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< 

(54) Bezeichnung: KONSTRUKTE UND VERFAHREN ZUR REGULATION DER GENEXPRESSION 

(57) Abstract: The invention relates to constructs and methods for the regulation of gene expression of at least two endogenous 
OC target genes by introduction of an at least partly double-stranded ribonucleic acid molecule into a eukaryotic cell or a eukaryotic 

organism, whereby the ribonucleic acid molecule comprises at least two ribonucleotide sequence sections which are homologous 
™ with various genes of the eukaryotic cell. 

o 

(57) Zusammenfassung: Die vorliegende Erfindung betrifft Konstrukte und Verfahren zur Regulation der Genexpression von min- 
Q destens zwei endogenen Zielgenen durch Einbringen eines zumindest teilweise doppelstrangigen Ribonukleinsauremolekuls in eine 

cukaryotische Zcllc odereinen eukaryotischen Organismus, wobci das Ribonukleinsaurcmolekul mindestens zwei Ribonukleotidse- 
^ quenzabschnitte umfasst, die zu verschiedenen Genen der eukaryotischen Zelle homolog sind. 
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Konstrukte und Verfahren zur Regulation der Genexpression 
Beschreibung . 

5. 

Die vorliegende Erfindung betrifft Konstrukte und Verfahren zur 
Regulation der Genexpression von mindestens zwei endogenen Ziel- 
genen durch Einbringen eines zumindest teilweise doppelstrangigen 
Ribonukleinsauremolekiils in eine eukaryotische Zelle oder einen 
10 eukaryotischen Organismus, wobei das Ribonukleinsauremolekul min- 
destens zwei Ribonukleotidsequenzabschnitte umfasst, die zu ver- 
schiedenen Genen der eukaryotischen Zelle homolog sind. 

Die gezielte Inhibition der Genexpression definierter Gene ist 
15 eine der am meisten beforschten Technologie der Biotechnologie . 
Die Expression von antisense-RNA ist dabei der am hSufigsten ver- 
wendet Ansatz und vielfach besdhrieben (u.a. EP-A1 0 458 367; 
EP-Al 0 140 308; van der Krol AR et al. (1988) BioTechniques ' 
6(10) :658-676; de Lange P et al. (1995) Curr Top Microbiol Immu- 
20 nol 197:57-75). Antisense-RNA vermittelte Ans&tze haben jedoch 
den Nachteil, dass stochiometrische Mengen der antisense-RNA er- 
f order lich sind, um eine wirksame Inhibition der Ziel-mRNA zu be- 
wirken. Weitere Probleme stehen im Zusammenhang mit dem Einbrin- 
gen der antisense-RNA in ausreichenden Mengen in die Zellen und 
25 mit der Labilitat der antisense-RNA. Ansatze basierend auf anti- 
sense-RNA sind daher meist ineffizient. 



Ein weiterer Ansatz zur Genregulation ist die u Co-Suppression" 
und meint die Verminderung der Expression eines endogenen Ziel- 

30 gens durch transgene Expression einer sense-RNA dieses Zielgens 
(EP-Al 0 465 572) . Der Co-Suppression liegen vermutlich mehr als 
ein Mechanismus zugrunde. Nachteilig ist die mangelnde Verlass- 
lichkeit und Reproduzierbarkeit des Verfahrens. In manchen Fallen 
erfolgt Suppression, wahrend in anderen Fallen - bedingt durch 

35 die Expression der sense-RNA - die erwartete Uberexpression er- 
folgt. Auch ist der erhaltene Phanotyp oft nicht stabil. Die An- 
wendung der Co-Suppression ist im wesentlichen auf Pf lanzen be- 
schrankt . 

40 Verschiedene Abwandlungen der Verfahren basierend auf antisense- 
RNA oder Cosuppression sind bekannt. So beschreibt WO 93/23551 
ein Verfahren zur Inhibition mehrerer Gene durch Expression einer 
chimaren antisense-RNA oder sense-RNA. Das Verfahren kann die lib- 
lichen mit antisense-RNA oder sense-RNA verbundenen Probleme 
nicht I6sen und bleibt ineffizient. 



WO 98/36083 und WO 99/15682 beschreiben die Regulation der Genex- 
pression mittels viraler Expressionssysteme ("virus induced gene 
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silencing 0 VTGS) . 

WO 99/32619 und WO 99/53050 beschreiben Verfahren zur Inhibition 
einzelner Zie°lgene unter Verwendung einer RNA mit doppelstrangi- 
5 ger Struktur, wobei das Zielgen und die Region der RNA Duplex zu- 
mindest eine teilweise Identitftt aufweisen (siehe auch: Montgom- 
ery MR et al. (1998) Proc Natl Acad Sci USA 95:15502- 15507; 
Sharp PA (1999) Genes & Development 13 (2) : 139-141; Fire A et al. 
(1998) Nature 391:806-11). Das Verfahren wird heute auch als 
10 "RNA- Inter ference" (RNAi) bezeichnet und hat in Mechanismus uiid 
Wirkung Ahnlichkeiten mit dem oben erwahnten VIGS Verfahren. 

Die beschriebenen Verfahren, insbesondere das RNAi -Verfahren, 16- 
sen zwar einige Probleine im Zusammenhang mit der .Verxhinderung 

15 einzelner Zielgene. Fur andere Probleme, insbesondere fur die 
parallele Suppression mehrerer Zielgene, konnte jedoch bislang 
keine bef riedigende Losung bereit gestellt werden. Zahlreiche An- 
satze in der Biotechnologie erfordern nicht nur die Verminderung 
eines einzelnen Zielgens, sondern mehrerer Zielgene, wie bei- 

20 spielsweise verschiedener Gene eines oder verschiedener Stoff- 
wechselwege oder ganzer Genfamilien. Bislang war dies nur. mit er- 
heblichen Arbeits- und Zeitaufwand zu realisieren. Die Ansatze 
erforderten oft die individuelle Regulation der einzelnen Ziel- 
gene durch sukzessive Transformation beispielsweise mit verschie- 
denen Expressionskonstrukten, die jeweils far eine antisense RNA 

25 eines Zielgens kodierten. Neben dem erheblichen Arbeits- und 
Zeitaufwand, besteht dabei der Nachteil, das fur viele Systeme 
und Organismen nur eine beschrankte Anzahl von Selektionsmarkera, 
geeigneten Promotoren etc. zur Verfiigung steht, was multiple 
Trans format ionen erheblich erschwert und beispielsweise die Dele- 

30 tion der Marker nac h der Transformation und . Selektion erfordert. 
Die mehrfache Verwendung eines Promotors hat oft unerwunschte 
Folgen, wie beispielsweise ein epigenetisches Gene-Silencing. 
Hierbei kommt es infolge der mehrf ach verwendeten Kontrollseguen- 
zen zu einer Inaktivierung derselben, vergleichbar der oben be- 

35 schriebenen Cosuppression. 

Es stellte sich also die Aufgabe, neue Verfahren bereit zu stel- 
len, die eine effiziente Verminderung der Expression mindestens 
zweier endogener Zielgene in einer eukaryotischen Zelle oder ei- 
40 n em eukaryotischen Organismus ermoglichen. Diese Aufgabe wird 
durch die vorliegende Erfindung gelost. 

Ein erster Gegenstand der Erfindung betrifft Verfahren zur Ver- 
minderung der Expression von mindestens zwei ver schiedenen , endo- 
45 genen Zielgenen in einer eukaryotischen Zelle oder einem eukaryo- 
tische Organismus durch Einbringen eines zumindest teilweise dop- 
pelstrangigen RibonukleinsSuremolekuls in besagte eukaryotische 
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Zelle oder besagten eukaryotischen Organismus, wobei das doppel- 
strangige Ribonukleinsauremolekul umfasst 

a) mindestens zwei w sense"-Ribonukleotidsequenzen, wobei jeweils 
5 mindestens eine dieser * sense "-Ribonukleotidsequenzen im we- 

sentlichen identisch ist zu mindestens einem Teil des 
"sense" -RNA-Transkriptes eines jeden der besagten endogenen 
Zielgene und 



10 b) n antisense"-Ribonukleotidsequenzen, die zu besagten 

w sense"-Ribonukleotidsequenzen unter a) im wesentlichen kom- 
plementaren sind. 

Ein weiterer Gegenstand der Erfindung umfasst ein zumindest teil- 
15 weise doppelstrangiges Ribonukleinsauremolekul, wobei das doppel- 
strangige Ribonukleinsauremolekul umfasst 

a) mindestens zwei * sense "-Ribonukleotidsequenz en, wobei jeweils 
mindestens eine dieser w sense "-Ribonukleotidsequenz en im we- 

20 sentlichen identisch ist zu mindestens einem Teil des 

W sense"-RNA-Transkriptes eines endogenen Zielgens, wobei je- 
doch nicht alle n sense"-Ribonukleotidsequenzen zu dem 
tt sense "-RNA-Transkript eines einzigen endogenen Zielgens 
identisch sind, und 

25 

b) "antisense"-Ribonukleotidsequenzen, die zu besagten 
*sense"-Ribonukleotidsequenzen unter a) im wesentlichen kom- 
plementclren sind. 



30 Umfasst ist ferner die Verwendung der erf indungsgemafien doppel- 
strangiges Ribonukleinsauremolekul in einem der erf indungsgemS£en 
Verf ahr en . 



Die vorliegende Erfindung 16st die oben geschilderten Probleme 
35 und ermoglicht eine schnelle, besonders effiziente Methode zur 
Regulation der Expression verschiedener Zielgene. Insbesondere 
ergeben sich folgende Vorteile: 

a) Transgene Organismen oder Zellen, in denen mehr als ein Ziel- 
40 gen inhibiert wird, konnen in einer einzigen Transformation 

erzeugt werden. 

b) Die Trans kript ions rate fur jeden Ribonukleotidsequenz der 
dsRNA ist gleich. Dadurch werden multiple Ph&notypen durch 

45 unterschiedliche Express ionshohen verhindert, wie sie bei in- 

dividueller Expression separater Ribonukleotidsequenzen - 
beispielsweise durch den unterschiedlichen Ort der Insertion 
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in das Genom - oft entstehen. Dieser Vorteil gewahrleistet 
eine gleichbleibend hohe Inhibition aller Zielgene und ver- 
mindert dramatisch die erf order lichen Selektionsschritte zu 
Generierung eines Organismus, bei dem alle Zielgene effizient 
5 supprimiert werden. 

c) Ein okonomischer Umgang mit Kontrollelementen wie Promotoren 
und Selektionsmarkern wird ermoglicht. Zudem erubrigen sich 
Probleme, wie sie bei der mehrfachen Verwendung eines be- 

10 stimmten Kontrollelementes,. insbesondere eines Promoters, 

entstehen konnen ("epigenic gene silencing") . 

d) Eine Segregation der einzelnen Ribonukleotidsequenzen bei 
nachfolgenden Zuchtungs- und Kreuzungsschritten, wie sie bei 

15 der Verwendung mehrerer Expressionskonstrukte zwangslaufig 

entsteht, wird verhindert'. Dadurch wird die nachfolgende 
Zuchtung stabiler Linien erheblich erleichtert und beschleu- 
nigt . 

20 e) Organismen mit komplexen beispielsweise polyploide Genomen, 
wie beispielsweise manche Pflanzen, sind einer effizienten 
Gensuppression zuganglich. Aufgrund der zahlreichen Kopien 
fur einzelne Gene sind diese Organismen klassischen verfahren 
der Mutagenese und Selektion nicht zuganglich. 

25 

Uberraschenderweise konnte bei dem erf indungsgemafcen Verfahren 
keine st6rende Interferenz zwischen den einzelnen Ribonukleotid- 
sequenzabschnitte untereinander beobachtet werden. 

30 "Endogenes Zielgen einer eukaryotischen Zelle oder ■ eines eukaryo- 
tische Organismus * meint jede Nukleinsauresequenz in einer euka- 
ryotischen Zelle, einem eukaryotische Organismus oder einem Teil, 
Organ, Gewebe, Samen etc. desselben,' die zur Transkription befa- 
higt ist. Dabei kann es sich urn naturlicherweise vorkommende oder 

35 aber kiinstlich eingefuhrte Sequenzen (wie beispielsweise trans- 
gene Sequenzen) handeln, wobei naturlicherweise vorkommende Se- 
quenzen bevorzugt sind. Naturlicherweise vorkommende Sequenzen 
sind bevorzugt und umfassen sowohl die eigenen Sequenzen der eu- 
karyotischen Zelle oder des eukaryotischen Organismus als auch 

40 Gene von Pathogenen, die in der eukaryotischen Zelle oder dem eu- 
karyotischen Organismus nach einem Befall durch ein Pathogen pre- 
sent sind. Das Zielgen kann in der chromosomalen DNA oder der DNA 
der Organellen (wie beispielsweise der Plastiden z.B. Chloropla- 
sten etc.) lokalisiert sein oder aber sich extrachromosomal in 

45 der Zelle befinden. Die naturlicherweise vorkommenden, eigenen 
Sequenzen des eukaryotischen Organsimus umfassen bevorzugt Gene 
desselben, die stabil im Genom vorliegen, wobei das Genom die Ge- 
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saintheit der genetischen Information meint und sowohl die chromo- 
somale als auch die plastidare DNA umfasst. Bevorzugt ist das en- 
dogene Zielgen ein natiirlicherweise in der chromosomalen DNA vor- 
koinmendes Gen. Bevorzugt sind Gene deren verminderte Expression 
5 zu einem veranderten Phanotyp fuhrt. 

"Verminderung" oder *vermindern" der Expression eines Zielgens 
ist im Zusammenhang weit auszulegen und umfasst die teilweise 
oder im wesentlichen vollstandige, auf unterschiedliche zellbio- 

10 logische Mechanismen beruhende Unterbindung oder Blockierung der 
Expression des Zielgens oder der von ihm abgeleiteten RNA, mRNA, 
rRNA, tRNA und/oder des dadurch kodierten Proteinproduktes in ei- 
ner, Zelle oder einem Organismus oder einem davon abgeleiteten 
Teil, Gewebe, Organ, Zelle oder Samen. Eine Verminderung im Sinne 

15 der Erfindung umfasst die mengenmslssige Verringerung einer vom 
Zielgen exprimierten RNA, mRNA, rRNA, tRNA und/oder des dadurch 
kodierten Proteinproduktes bis hin zu einem im wesentlichen voll- 
standigen Fehlen derselben. Dabei wird die Expression einer be- 
stimmten RNA, mRNA, rRNA, tRNA und/oder des dadurch kodierten 

20 Proteinproduktes in einer Zelle oder einem Organismus im Ver- 
gleich zu der selben Zelle oder Organismus, die dem Verfahren . 
nicht unterworfen wurden, bevorzugt urn mehr als 50%, besonders 
bevorzugt um mehr als 80%, ganz besonders bevorzugt urn mehr als 
90%, am meisten bevorzugt mehr al 95% vermindert. Dabei kann die 

25 Verminderung durch dem Fachmann gel&uf igen Verfahren ermittelt 
werden. So kann die Verminderung der Proteinmenge beispielsweise 
durch immunologischen Nachweis des Proteins bestimmt werden. Wei- 
terhin konnen biochemische Techniken wie Northern-Hybridisie- 
rung, "nuclease protection assay", Reverse Transkription (quanti- 

30 tative RT-PCR) , ELISA ("enzyme linked immunosorbent assay"), We- 
stern-Blotting, Radioimmunoassay (RIA) oder andere Immunoassays 
sowie "fluorescence activated cell analysis" (FACS) eingesetzt 
werden. Je nach Art des verminderten Proteinproduktes kann auch 
dess Aktivitat oder der Einfluss auf den PhSnotyp des Organismus 

35 oder der Zelle ermittelt werden. 

"Proteinmenge" meinte die Menge eines bestimmten Polypeptides in 
einem Organismus, einem Gewebe, einer Zelle oder einem Zellkom- 
partiment . 

40 

"Verminderung" der Proteinmenge meint die mengenmafiige Verminde- 
rung der Menge eines bestimmten Polypeptides in einem Organismus, 
einem Gewebe, einer Zelle oder einem Zellkompartiment - bei- 
spielsweise durch das erf indungsgemafce Verfahren - im Vergleich 
45 zu dem Wildtyp derselben Gattung und Art auf den dieses Verfahren 
nicht angewendet wurde, unter ansonst gleichen Rahmenbedingungen 
(wie beispielsweise Kulturbedingungen, Alter, NMhrstof f zufuhr 
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etc.). Der Vermindemng betragt dabei mindestens 10 %, bevorzugt 
mindestens 10% oder mindestens 20%, besonders bevorzugt um minde- 
stens 40% oder 60%, ganz besonders bevorzugt um mindestens 70% 
oder 80%, am meisten bevorzugt um mindestens 90% oder 95%. Ver- 
5 fahren zur Bestimmung der Proteinmenge sind dem Fachmann bekannt. 
Beispielhaft seien zu nennen: Das Mikro-Biuret Ver fahren (Goa J 
(1953) Scand J Clin Lab Invest 5:218-222), die Folin-Ciocalteu- 
Methode (Lowry OH et al. (1951) J Biol Chem 193:265-275) oder die 
Messung der Adsorption von CBB G-250 (Bradford MM (1976) Analyt 
10 Biochem 72:248-254). 

"Verschieden" meint in Bezug auf zwei endogene Zielgene bevor- 
zugt, dass die von den beiden endogenen Zielgenen transkribierte 
RNA oder mRNA nicht identisch ist. Bevorzugt ist die Homologie 
15 der von den beiden endogenen Zielgenen transkribierte RNA oder 
mRNA geringer als 90%, bevorzugt geringer als .80%, besonders be- 
vorzugt geringer als 70%, ganz besonders bevorzugt geringer als 
60%, am meisten bevorzugt geringer als 50% liber jeweils die ge- 
samte Lange der transkribierten RNA oder mRNA. 

20 

"Zumindest teilweise doppelstrangiges Ribonukleinsauremolekiil" 
(infolge dsRNA) meint Ribonukleins&uremolekttl, die ganz oder 
teilweise doppelstrangig sind. Bevorzugt ist die Ribonukleinsau- 
resequenz uberwiegend vollstandig doppelstrangig. "Uberwiegend 

25 vollstandig doppelstrangig" meint, dass zumindest 50%, bevorzugt 
70%, besonders bevorzugt 80%, ganz besonders bevorzugt 90% der in 
dem Molekiil vorhandenen Basen in Paarung mit einer anderen Base 
der dsRNA vorliegen oder - entsprechend der Sequenz der dsRNA und 
den Basenpaarregeln sowie gegebenenf alls einer RNA-Sekundarstruk- 

30 turvoraussage mittels eines geeigneten Computeralgorithmus - zu- 
mindest theoretisch vorliegen konnen. 

w Im wesentlichen identisch" meint, dass eine w sense" -Ribonukleo- 
tidsequenz der dsRNA auch Insertionen, Deletionen sowie einzelne 

35 Punktmutationen im Vergleich zu der Sequenz des *sense"-RNA- 

Transkriptes eines endogenen Zielgens aufweisen kann. Mutationen 
umfassen Subs ti tut ionen, Additionen, Deletionen, Inversion oder 
Insertionen eines oder mehrerer Basen einer Nukleinsauresequenz . 
Bevorzugt betragt die Homologie zwischen einer * sense" -Ribonu- 

40 kleotidsequenz einer dsRNA und mindestens einem Teil des 

X> sense"-RNA-Transkript eines endogenen Zielgens mindestens 60 %, 
bevorzugt mindestens 70 %, ganz besonders bevorzugt mindestens 90 
%, am meisten bevorzugt 95%. Die Sequenzen konnen auch identisch 
mit der korrespondierenden Sequenz des Zielgens sein. Eine 

45 100%ige Sequenzidentitat zwischen der * sense "-Ribonukleotidse- 
quenz der dsRNA und mindestens einem Teil des "sense "-Stranges 
der Transkriptes eines endogenen Gens ist bevorzugt, wenn gleich 
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nicht zwingend erf orderlich, um eine effiziente Verminderung der 
Expression des endogenen Gens zu bewirken. Einzelne Mutationeri 
warden toleriert. Das Verfahren ist demnach tolerant gegeniiber 
Sequenzabweichungen, wie sie infolge genetischer Mutationen, Po- 
5 lymorphismen oder evolutionarer Divergenzen vorliegen konnen. So 
ist es beispielsweise auch moglich mit einer einzigen dsRNA, die 
ausgehend von einer bestimmten endogenen Gen generiert wurde, die 
Expression weiterer homologer endogener Gene des gleichen Orga- 
nismus oder aber auch die Expression homologer endogener Gene in 
10 anderen verwandten Arten zu unterdriicken . 

Unter Homologie wird das Ma£ der Ubereinstimmung zwischen zwei 
Nukleotid-, Ribonukleotid- oder Proteinsequenzen verstanden, 
die bevorzugt durch Vergleich mit Hilf e des Programmalgorithmus 
15 GAP (Wisconsin Package Version 10.0, University of Wisconsin, Ge- 
netics Computer Group (GCG) , Madison, USA; Altschul et al. (1997) 
Nucleic Acids Res. 25:3389ff) unter Einstellung folgender Parame-. 
ter berechnet wird: 

20 Gap Weight: 50 Length Weight: 3 

Average Match: 10 Average Mismatch: 0 

Dem Fachmann ist bewusst, dass wenn die Homologie zwischen DNA 
25 (z.B. Genen) und RNA bestimmt wird, Thymin (T) in der DNA Sequenz 
als Equivalent zu Uracil (U) in der RNA Sequenz betrachtet wird. 

w Teil des * sense ff -RNA-Transkriptes eines endogenen Zielgens" 
meint Fragmente' einer RNA oder mRNA transkribiert von einem endo- 

30 genen Zielgen. Dabei hat besagtes Teil bevorzugt eine Sequenz - 
lange von mindestens 10 Basen, bevorzugt mindestens 25 Basen, be- 
sonders bevorzugt mindestens 50 Basen, ganz besonders bevorzugt 
mindestens 100 Basen, am meisten bevorzugt mindestens 200 Basen 
oder mindestens 300 Basen. Umfasst ist auch die vollstandige 

35 transkribierte RNA oder mRNA. 

Alternativ, kann eine w im wesentlichen identische" dsRNA auch als 
Nukleinsauresequenz definiert werden, die befahigt ist, mit einem 
Teil eines Transkriptes , bevorzugt der mRNA, eines endogenen 
40 Zielgenes zu hybridisieren (z.B. in 400 mM NaCl, 40 mM PIPES pH 
6,4, 1 mM EDTA bei 50°C oder 70°C fur 12 bis 16 h oder unter ande- 
ren Standardhybridisierungsbedingungen) . 

w Standardhybridisierungsbedingungen w ist breit zu verstehen und 
45 meint weniger stringente als auch - bevorzugt - stringente Hybri- 
disierungsbedingungen. Solche Hybridisierungsbedingungen sind 
unter anderem bei Sambrook J, Fritsch EF, Maniatis T et al . , in 
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Molecular Cloning (A Laboratory Manual), 2. Auflage, Cold Spring 
Harbor Laboratory Press, 1989, Seiten 9.31-9.57) oder in Current 
Protocols in Molecular Biology, John Wiley &Sons, N.Y. (1989), 
6.3.1-6.3.6. beschrieben. 

5 

Beispielhaft konnen die Bedingungen wahrend des Waschschrittes 
ausgewahlt sein aus dem Bereich von Bedingungen begrenzt von sol- 
chen mit geringer Stringenz (mit ungefahr 2X SSC bei 50°C) und - 
bevorzugt - solchen rait hoher Stringenz (rait ungefahr 0,2X SSC 

10 bei 50°C bevorzugt bei 65°C) (2 OX SSC: 0,3 M Natriumcitrat , 3 M 
NaCl, pH 7.0) . Dartiberhinaus kann die Temperatur wahrend des 
Waschschrittes von niedrig stringenten Bedingungen bei Raumtempe- 
ratur, ungefahr 22°C, bis zu - bevorzugt - starker stringenten Be- 
dingungen bei ungefahr 65°C angehoben werden. Beide Parameter, 

15 Salzkonzentration und Temperatur, konnen gleichzeitig variiert 
werden, auch kann einer der beiden Parameter konstant gehalten 
und nur der andere variiert werden. wahrend der Hybridisierung 
konnen auch denaturierende Agenzien wie zum Beispiel Formamid 
oder SDS eingesetzt werden. In Gegenwart von 50% Formamid wird 

20 die Hybridisierung bevorzugt bei 42°C ausgefxihrt. Einige beispiel- 
haf te Bedingungen fur Hybridisierung und Waschschritt sind in- 
folge gegeben: 

(1) Hybridisierungbedingungen zum Beispiel aus nachf olgenden Be- 
25 dingungen ausgewahlt sein: 

a) 4X SSC bei 65°C, 

b) 6X SSC bei 45°C, 

c) 6X SSC, 100 Jig /ml denaturierter , f ragmentierte Fischsper- 
30 ma-DNA bei 68°C, 

f) 50% Formamid, 4X SSC bei 42°C, 

h) 2X oder 4X SSC bei 50°C (schwach stringente Bedingung) , 

i) 30 bis 40 % Formamid, 2X oder 4X SSC bei 42°C {schwach' 
stringente Bedingung) . 

35 

(2) Waschschritte k6nnen zum Beispiel aus nachf olgenden Bedingun- 
gen ausgewahlt sein: 

a) 0,015 M NaCl/0,0015 M Natriumcitrat/0, 1% SDS bei 50°C. 
40 b) 0,1X SSC bei 65°C. 

c) 0,1X SSC, 0,5% SDS bei 68°C. 

d) 0,1X SSC, 0,5% SDS, 50% Formamid bei 42°C. 

e) 0,2X SSC, 0,1% SDS bei 42°C. 

f) 2X SSC bei 65°C (schwach stringente Bedingung). 



45 



*Im wesentlichen komplementar* meint, dass die "antisense"-Ribo- 
nukleotidsequenzen der dsRNA auch Insertionen, Deletionen sowie 
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einzelne Punktmutationen im Vergleich zu dem Komplement der 
"sense" -Ribonukleotidsequenzen aufweisen kann. Bevorzugt betragt 
die Homologie mindestens 80 %, bevorzugt iaindestens 90 %, ganz 
besonders bevorzugt mindestens 95 %, am meisten bevorzugt 100% 
5 zwischen den w antisense"-Ribonukleotidsequenzen und dem Komple- 
ment der * sense "-Ribonukleotidsequenzen. Komplement meint dabei - 
in der dem Fachmann gelaufigen Weise - den entsprechend den Ba- 
senpaarregeln abgeleiteten Gegenstrang. 

10 Die doppelstrangige Struktur der dsRNA kann ausgehend von einem 
einzigen, ganz oder teilweise selbstkomplementaren RNA-Strang 
(bei dem die oben erwahnten n sense ff - und w antisense"-Ribohukleo- 
tidsequenzen der dsRNA alls kovalent miteinander verbunden sind) 
oder ausgehend von zwei RNA-Strangen (indem die oben erwahnten 

15 "sense"- und »antisense"-Ribonukleotidsequenzen der dsRNA auf se- 
parate Strange vorliegen) , die zueinander ganz oder teilweise . 
komplemen'tar sind, 'gebildet werden. Bei zwei separaten Strangen 
kannen beispielsweise alle «sense"-Ribonukleotidsequenzen auf dem 
einen und alle «antisense"-Ribonukleotidsequenzen auf dem anderen 
Strang vorliegen. Die Sequenzen konnen aber auch anders auf die 
beiden Strange verteilt sein. Die Ausbildung der doppelstrangigen 
Struktur kann in vitro aber auch in vivo - beispielsweise in der 
eukaryotischen Zelle selber - erfolgen. Bevorzugt liegt die dsRNA 
in Form eines einzigen, selbstkomplementaren RNA-Stranges vor. 

Die einzelnen * sense "-Ribonukleotidsequenzen konnen mit den kor- 
respondierenden, im wesentlichen komplementaren »antisense"-Ribo- 
nukleotidsequenzen eine doppelstrangige RNA-Struktur mittels Ba- 
senpaarung ausbilden und bilden eine Untereinheit der dsRNA. 

Im Falle eines selbstkomplementaren Stranges ergeben sich ver- 
schiedene Moglichkeiten fur die Primar struktur der dsRNA . ■ Nach- 
folgend aufgefiihrte sind beispielshaf t , jedoch nicht einschran- 
kend zu verstehen: 

a) Es konnen zunachst die « sense" -Ribonukleotidsequenzen (S) der 
einzelnen Untereinheit en aneinander gefiigt werden, wodrauf 
dann eine Aneinanderreihung der im wesntlichen komplementaren 
w antisense"-Ribon\ikleotidsequenzen (AS) folgt. Die Anzahl der 
Einheiten n ist groEer oder gleich zwei. Es entsteht eine 
Struktur mit einer einzelnen Haarnadel. Die Primar struktur 
der dsRNA kann dabei schematisch beispielsweise wie folgt 
aussehen: 



25 
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5'-S(l)-S(2)- -S(n)-AS(n)- -AS (2) -AS (1) -3 ' 
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Die bevorzugte Sekundarstruktur ist in Fig. 2 -A wiedergege- 
ben. 

b) Es konnen zunachst die tt sense"-Ribonukleotidsequenz (S) und 
5 die im wesentlichen komplementare *antisense"-Ribonukleotid- 

sequenz (AS) der ersten Untereinheiten aneinander' gefugt wer- 
den, wodrauf dann die Aneinanderreihung von "sense"- und tt an- 
tisense"-Ribonukleotidsequenzen der weiteren Untereinheiten 
folgt. Die Anzahl der Einheiten n ist gr6£er oder gleich 
10 zwei. Es entsteht eine Struktur mit mehreren Haarnadeln. Die 

Prim&rstruktur der dsRNA kann dabei schematisch beispiels- 
weise wie. folgt aussehen: 

5'-S(l)-AS(l)-S(2)-AS(2) -S (n) -AS <n) -3 ' 

15 

Die bevorzugte Sekundarstruktur ist in Fig. 2-B wiedergegeben. 

Ist die dsRNA - bevorzugt - in der Lage eine Haarnadelstruktur 
auszubilden, so entspricht der Stamm der Haarnadel dem doppel- 

20 strangige Anteil der dsRNA, der durch Basenpaarung zwischen auf 
dem gleich RNA-Mo 1 ektil e lokalisierten "sense"- und w antisense fl - 
Ribonukleotidsequenz gebildet wird. Dabei werden "sense"- und 
«antisense"-Ribonukleotidsequenzen bevorzugt durch einen "Linker* 
verbunden. Der "Linker" ist bevorzugt ein Intron, das aus der 

25 dsRNA herausgespleifct werden kann. Selbstkomplementaren dsRNA- 
Strukturen ausgehend von einem einzelnen RNA-Molekul sind bevor- 
zugt, da sie lediglich die Expression eines Konstruktes erfordern 
und die komplementaren RNA-Strange stets in einem aquimolaren 
Verhaltnis umfassen. 

30 

Bei der Verwendung eines .Linkers (I) - bevorzugt eines .Intron - 
seien nachf olgende schematische Primarstrukturen fur die dsRNA 
beispielhaft genannt: 

35 c) Dies ist eine bevorzugte Variante von a), bei der an der 

Stelle der Haarnadelschlaufe ein Linker (I) - bevorzugt ein 
Intron - insert iert wird: 

5'-S(l)-S(2)- -S(n)-I-AS(n)- -AS (2) -AS (1) -3 ' 

40 

Die bevorzugte Sekundarstruktur ist in Fig. 2-C wiedergege- 
ben. 

d) Dies ist eine bevorzugte Variante von b) , bei der an der 
45 Stelle der jeder Haarnadelschlaufe ein Linker (I) - bevorzugt 

ein Intron - insertiert wird: 
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5<-S(l)-I-AS(l)-S(2)-I-AS(2) -S (n) -I-AS (n) -3 ' 

Die bevorzugte Sekundarstruktur ist in Fig. 2-D wiedergege- 
5 ben. 

Die dsKNA Molekiile sind jedoch auch ohne den Linker f unktionell . 
Dabei ist jedoch zu beriicksichtigen, dass die letzten ca. 10 Nu- 
kleotide der terminalen Untereinheit S(n) in diesem Fall nicht 

10 mehr korrekt paaren. In diesem Fall ist die L&ige fur diese Un- 
tereinheit um 10 Nukleotide zu erganzen. Der Linker ist bevorzugt 
ein Intron, besonders bevorzugt ein Intron in sense-Orientierung. 
Bevorzugt handelt es sich um ein Intron eines pflanzlichen Gens. 
Beispielhaft jedoch nicht einschrankend seien zu nennen: Das In- 

15 tron 3 der Alkoholdehydrogenase 1 (Adhl) aus Mais (GenBank Acc- 
No.: AF044293; 61: 2828164), das Intron 4 der beta-Conglycinin 
alpha Untereinheit aus Soja (GenBank Acc.-No.: AB051865); eines 
der Introns des rbcS-3A Gens far Ribulose-1 . 5-bisphosphatcarboxy- 
lase (RBC) kleine Untereinheit aus Erbse (GenBank Acc.-No.: 

20 X04333) . Diese und weitere geeignete Introns sind dem Fachmann 
bekannt (McCullough AJ & Schuler MA (1997) Nuc Acids Res 
25:1071-1077). Fiir die Anwendung in dem erf indungsgemaEen Verfah- 
ren wird das Intron bevorzugt in Kombination mit Spleifcakzeptor- 
und SpleiSdonorsequenzen eingesetzt, die ein spateres Heraus- 

25 spleifcen aus der dsRNA ermSglichen. Diese Splei&sequenzen konnen 
die flankirenden Sequenzen des Intron selber sein, oder aber auch 
durch dentsprechende Sequenzen der tiberigfen dsRNA bereitgestellt 
werden . 

30 Jede der einzelnen n sense"-Ribonukleotidsequenzen der dsRNA ist 
im wesentlichen identisch' zu mindestens einem Teil des . 
w sense "-RNA-Transkriptes eines endogenen Zielgens. Dabei sind je- 
doch nicht alle w sense "-Ribonukleotidsequenzen zu dem 
" sense" -RNA-Transkript eines einzigen endogenen Zielgens iden- 

35 tisch, sondern die jeweils maximale Identit&t von mindestens zwei 
der tt sense "-Ribonukleotidsequenzen besteht zu den U sense"-RNA- 
Transkripten von unterschiedlichen endogenen Zielgenen. Dabei be- 
tragt die Homologie zwischen den Transkripten der beiden endoge- 
nen Zielgene unter 90%, bevorzugt unter 80%, besonders bevorzugt 

40 unter 70%, ganz besonders bevorzugt unter 60%, am meisten bevor- 
zugt unter 50%. 

Mindestens zwei der in der erf indungsgemafcen dsRNA umfassten ein- 
zelnen w sense"-Ribonukleotidsequenzen sind unterschiedlich. Un- 
45 terschiedlich bedeutet zum einen, dass die Zielgene zu deren 

Transkripten sie die jeweils maximale Identitat aufweisen, nicht 
identisch sind. Bevorzugt vermindert mindestens eine Untereinheit 
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der dsRNA die Expression eines anderen Gens als mindstens eine 
andere Untereinheit. Unterschiedlich kann zum anderen auch hei- 
Sen,dass die * sense "-Ribonukleotidsequenzen der Untereinheiten 
selber im wesentlichen nicht identisch sind und bevorzugt eine 
5 Homologie zu einander unter 60%, besonders bevorzugt unter 50% 
ganz besonders bevorzugt unter 40% aufweisen. Die dsRNA kann in 
einer weiteren Ausfiihrungsf orm meherer Kopien einer Untereinheit 
enthalten. Weiterhin kann die dsRNA auch mehrere verschiedene Un- 
tereinheiten enthalten, die aber gegen das gleiche endogene Ziel- 
10 gens gerichtet sind und deren tt sense"-Ribonukleotidseguenzen bei- 
spielsweise im wesentlichen identisch sind zu unter schiedlichen 
Teilen des U sense"-RNA-Transkriptes des besagten endogenen Ziel- 



15 Dabei kann jede der einzelnen n sense"~Ribonukleotidseguenzen auch 
zu dem Trans kript mehrerer endogener Zielgene im wesentlichen 
identisch sein. Dies ist besonders dann der Fall, wenn die Ziel- 
gene iiber ahnliche Sequenzabschnitte verfiigen, wie es beispiels- 
weise bei Mitgliedern von Genfamilien (z.B. Speicherproteinen) 

20 der Fall ist. Dies ist eine besonders vorteilhafte Anwendungs- 
form, da - bei entsprechender Wahl der Ribonukleotidsequenz einer 
Untereinheit - besagte Untereinheit die Expression von mehr als 
einem Zielgen vermindern kann. 

25 Vorzugsweise wird die Sequenz der dsRNA so gewahlt, dass die an- 
gestrebte dsRNA Struktur nach Ausbildung der Duplex - im Ver- 
gleich zu anderen moglichen Faltungsvarianten der Primar struktur 
der dsRNA - die jeweils geringste freie Energie hat. Dies kann 
beispielsweise durch Vermeidung von Sequenzduplikationen etc. ge- 

30. wShrleistet werden. Die spezifische Sekund&rstruktur kann bei- 
spielsweise mit geeigneten Computerprogramraen vorausgesagt und 
optimiert werden (z.B. FOLDRNA; Zuker and Stiegler (1981) Nucleic 
Acids Res 9(1) : 133-48) . 

35 Jede Untereinheit der dsRNA hat in einer bevorzugten Ausfuhrungs- 
form eine Lange von mindestens 20 Basenpaaren, bevorzugt minde- 
stens 50 Basenpaaren, besonders bevorzugt mindestens 100 Basen- 
paare, ganz besonders "bevorzugt mindestens 250 Basenpaare. 

40 In einer weiterhin bevorzugten Ausfiihrungsf orm hat jede Einheit 
eine Lange eine ganzzahligen Vielfachen von 21 oder 22 Basenpaa- 
ren, also beispielsweise 21, 22, 42, 43, 44, 63, 64, 65, 66, 84, 
85, 86, 87, 88, 105, 106, 107, 108, 109, 110, 126, 127, 128, 129, 
131, 132, 147, 148, 149, 150, 151, 152, 153, 154, 168, 169, 170, 



45 171, 172, 173, 174, 175, 176, 189, 190, 191, 192, 193, 194, 195, 
196, 197, 198, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219 
oder 220 Basenpaare, bevorzugt 21, 22, 42, 44, 63, 66, 84, 88, 



gens. 
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105, 110, 126, 132, 147, 154, 168, 176, 189, 198, 210 oder 220 
Basenpaare, ganz besonders bevorzugt 21, 42, 63, 84, 105, 126, 
147, 168, 189 oder 210 Basenpaare, am meisten bevorzugt 180 oder 
210 Basenpaare. 

5 

Die "sense"- und/oder "antisense"-Ribonukleotidsequenzen der ein- 
zelnen Untereinheiten konnen direkt oder aber durch einen w Spa- 
cer" (SP; Abstandshalter) miteinander verbunden und/oder flan- 
kiert sein. Die einzelnen "Spacer" (SP) konnen dabei identisch 

10 oder aber auch unterschiedlich sein. Der "Spacer" gemigt dabei 
bevorzugt den gleichen Langenanf orderungen wie sie oben fiir die 
Lange der Untereinheiten selber gegeben sind. Der "Spacer" kann 
eine doppelstrange Struktur ausbilden, kann aber auch - bei- 
spielsweise in Form einer Blase - in ungepaarter Formation beste- 

15 hen, d.h. die Basen in Strang und Gegenstrang miissen nicht zwin- 
genderweise komplementar sein. Bevorzugte Ausftihrungsf ormen sind 
zum Beispiel durch nachfolgende Primar struktur en beschrieben: 

e) Dies ist eine bevorzugte Variante von c) : 

20 

5'SP-S(1)-SP-S(2)-SP-. . -S(n) -AS (n)-SP-. . -AS (2) -SP-AS (1) -SP-3 ' 

Die bevorzugte Sekundar struktur ist in Fig. 3-A wiedergege- 
ben. 

25 

Der "Spacer" kann weitere Funktionselemente umfassen. Beispiel- 
haft jedoch nicht einschrankend sind zu nennen: 

i) Sequenzen kodierend fiir eine von einem Ribozym als Substrat 
30 erkannten Erkennungssequenz (RE) . Beispielsweise kann die 

dsRNA nachfolgende lineare Struktur vor der Faltung einneh- 
men: 

5'-S(l)-(RE)-S(2)-. . .-S(n)-AS(n)-. .-AS (2) - (RE) -AS(1) -3 ' 

35 

Die bevorzugte Sekundar struktur ist in Fig. 3-B wiedergege- 
ben. Das entsprechende Ribozym (R) kann separat exprimiert 
werden kann aber auch auf der dsRNA selber kodiert sein. Da- 
bei ist die Sequenz kodierend fur ein Ribozym bevorzugt so 
40 angeordnet, dass sie im gefalteten dsRNA Molekiil einer Se- 

quenz gegenuber liegt, die fiir dieses Ribozym als Substrat 
fungieren kann. Beispielsweise kann die dsRNA nachfolgende 
lineare Struktur vor der Faltung einnehmen: 



45 



5'-S(l)-(R) (RE)-S(2)-. . .-S(n)-AS(n)-. .-AS(2)-(R) (RE) -AS ( 1) -3 ' 
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Die bevorzugte Sekundarstruktur ist in Fig. 3-C wiedergege- 
ben. Durch die genannten Ausfiihrungsf ormen werden nach Tran- 
skription die einzelnen Untereinheiten durch Wirkung des Ri- 
bozym voneinander getrennt. Diese Trennung ist vorteilhaft, 
jedoch nicht zwingend erf orderlich. Eixtsprechend nutzbare Ri- 
bozyme und Erkennungssequenzen sind dem Fachmann bekannt. 

Ribozyme meint katalytische RNA-Molekule . Ribozyme kSnnen an 
jede beliebige Ziel-RNA angepasst werden und spalten das 
Phosphodiester-Geriist an spezifischen Positionen, wodurch die 
Ziel-RNA funktionell deaktiviert wird (Tanner NK (1999) FEMS 
Microbiol Rev 23 (3 ): 257-275) . Das Ribozym wird dadurch nicht 
selber modif iziert, sondern ist in der Lage, weitere Ziel- 
RNA-Molekiile analog zu spalten, wodurch es die Eigenschaf ten 
eines Enzyms erhalt. Der Einbau von Ribozymsequenzen in n an- 
tisense"-RNAs verleiht eben diesen *antisense"-RNAs diese en- 
zymShnliche, RNA-spaltende Eigenschaf t und steigert so deren 
Effizienz bei der Inaktivierung der Ziel-RNA. Die Herstellung 
und Verwendung entsprechender Ribozym-"antisense"-RNA-Mole- 
kiile ist beispielsweise beschrieben bei Haseloff et al. 
(1988) Nature 334: 585-591. Auf diese Art konnen Ribozyme 
(z.B. "Hammerhead" -Ribozyme; Haselhoff und Gerlach (1988) Na- 
ture 334:585-591) verwendet werden, um die eines bestimmte 
RNA katalytisch zu spalten. Verfahren zur Expression von Ri- 
bozymen zur Verminderung bestimmter Proteine sind beschrieben 
in (EP 0 291 533, EP 0 321 201, EP 0 360 257). In pflanzli- 
chen Zellen ist eine Ribozym-Expression ebenfalls beschrieben 
(Steinecke P et al. (1992) EMBO J 11 (4) : 1525-1530; de Feyter 
R et al. (1996) Mbl Gen Genet. 250 (3 ): 329-338) . Geeignete 
Zielsequenzen und Ribozyme konnen zum Beispiel wie bei * Stei- 
necke P, Ribozymes, Methods in Cell Biology 50, Galbraith et 
al. eds, Academic Press, Inc. (1995), S. 449-460" beschrieben, 
durch Sekundarstrukturberechnungen von Ribozym- und Ziel-RNA 
sowie durch deren Interaktion bestimmt werden (Bayley CC et 
al. (1992) Plant Mol Biol. 18 (2) : 353-361; Lloyd AM and Davis 
RW et al. (1994) Mol Gen Genet. 242 (6) : 653-657) . Beispiels- 
weise konnen Derivate der Tetrahymena L-19 IVS RNA kon- 
struiert werden, die komplementare Bereiche zu der mRNA des 
zu den Spacersequenzen aufweisen (siehe auch US 4,987,071 und 
US 5,116,742). Alternativ konnen solche Ribozyme auch uber 
einen Selektionsprozess aus einer Bibliothek diverser Ribo- 
zyme identif iziert werden (Bartel D und Szostak JW (1993) 
Science 261:1411-1418). 

Sequenzen kodierend fur Erkennungssequenzen fiir RNAasen 
Der w Spacer * kann Erkennungssequenzen ftir RNAsen, bevorzugt 
sequenzspezif ische RNAsen wie beispielsweise RNAse III ent- 
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halten. RNAse III schneidet am Motiv 5 ' -AGNN-3 , wenn vier 
dieser Motive in einer Schleife vorhanden sind (Nagel R & 
Ares M (2000) RNA 6:1142-1156). Die RNase kann eine pflanze- 
neigene RNAse sein, oder - wie beispiuelsweise fur bakte- 
5 rielle RNase III Proteine - auch transgen exprimiert werden. 

iii) Sequenzen kodierend fur IntronspeiSsignale (IS) . Dabei sind 
die SpleiSdonor und Splei&akzeptorsequenzen bevorzugt so lo- 
kalisiert, dass jeweils die Untereinheit als Intron heraus- 
10 gespleifct wird. IntronspleiSsignale sind in Meritt et 

al.(1997) Plant Journal 12:937-943 oder in Egoavil et al. 
(1997) Plant Journal 12:971-980 beschrieben. 

Die dsRNA bzw. ihre Voriauf ermolekiile konnen auf verschiedene dem 

15 Fachmann gelaufige Weise in einen Organismus oder eine Zelle ein- 
gebracht werden. "Einbringen"- ist Jareit zu verstehen iirid umfasst 
im Rahmen der Erfindung alle Verfahren, die dazu geeignet eine 
dsRNA bzw. ihre VorlSuf ermolekule , direkt oder indirekt, in einen 
Organismus oder eine Zelle, Kompartiment , Gewebe, Organ oder Sa- 

20 men desselben einzufuhren oder dort zu generieren. Die Einbrin- 
gung kann zu einer voriibergehenden ( trans ienten) Prasenz einer 
dsRNA fiihren oder aber auch zu einer dauerhaften (stabilen) . Um- 
fasst sind Verfahren der direkten Transf ektion oder Transforma- 
tion der Zelle mit der als auch die Transformation oder Trans- 

25 f ektion der Zelle mit Expressionskassetten, die befahigt sind, 
die der dsRNA zugrundeliegenden RibonukleinsSuresequenzen in der 
Zelle zu exprimieren (infolge dsRNA-Expressionssystem) . Die Ex- 
pression der dsRNA kann transient oder - beispielsweise nach In- 
tegration in das Genom des Organismus - permanent erfolgen. Die 

30 Duplex-Bildung der dsRNA kann entweder aufcerhalb der Zelle oder 
innerhalb derselben initiiert werden. 

Die dsRNA wird in einer Menge eingefiihrt, die zumindest eine Ko- 
pie pro Zelle ermoglicht. Hohere Mengen (z.B. mindestens 5, 10, 

35 100, 500 oder 1000 Kopien pro Zelle) konnen ggf . eine effizienter 
Verminderung der Expression der Zielgene bewirken. Da dsRNA eine 
aufcerordentlich gute Mobilitat innerhalb eines Organismus hat, 
ist es nicht zwingend erforderlich die dsRNA in jede Zelle des 
Organismus zu applizieren. Es ist ausreichend, die dsRNA in eine 

40 oder wenige Zellen einzubringen oder zu exprimieren, wobei die 
erf indungsgemaSe Wirkung dann auch in anderen Zellen des gleichen 
Organismus erzielt werden kann. 

Eine dsRNA - beispielsweise zur Verwendung in einer direkten 
45 Transformation oder Transfektion - kann kann in vivo oder in vi- 
tro, durch enzymatische, molekularbiologische oder chemisch-syn- 
thetische Verfahren synthetisiert werden. Dazu kdnnen eukaryoti- 
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sche, prokaryotische oder Bakteriophagen RNA Polymerasen (wie 
z.B. T3-, T7- oder SP6 RNA-Polymerase) verwendet werden. Entspre- 
chende Verfahren zu in vitro Expression von RNA sind beschrieben 
(WO 97/32016; US 5,593,874; US 5,698,425, US 5,712,135, US 
5 5,789,214, US 5,804,693). Eine chemisch oder enzymatisch in vitro 
synthetisierte dsRNA kann vor der Einfuhrung in eine Zelle, Ge- 
webe oder Organismus aus dem Reaktionsgemisch beispielsweise 
durch Extraktion, Prazipitation, Elektrophorese, Chromatographic 
oder Kombinationen dieser Verfahren ganz oder teilweise aufgerei- 

10 nigt werden. Die dsRNA kann direkt in die Zelle eingefiihrt werden 
(beispielsweise durch Partikelbeschufc oder Mikroinjektion) oder 
aber extrazellular (z.B. in den interstitial Raum, das GefaSsy- 
stem, das Verdauungssystem o.a.) appliziert werden. Auch eine Ap- 
plikation beispielsweise von dsRNA exprimierenden Organismen in 

15 Form von Nahrung ist denkbar. Es ist bekannt, dass dsRNA eine ■ 
gute Zellgangigkeit und ausreichende Stabilitat hat. Durch die 
hohe Wirksamkeit der dsRNA sind auch wenige Molekule ausreichend, 
urn eine gute Wirkung im Sinne der Erfindung zu erzielen. 

20 Es konnen ferner Modif ikationen sowohl des Zucker-Phosphat-Geru- 
stes als auch der Nukleoside in der dsRNA vorliegen. Beispiels- 
weise konnen die Phosphodiesterbindungender der RNA dahingehend 
modif iziert sein, dass sie zumindest ein Stickstoff oder Schwe- 
fel-Heteroatom umfassen. Basen konnen dahingehend modif iziert 

25 werden, dass die Aktivitat beispielsweise von Adenosindeaminase 
eingeschrankt wird. Die dsRNA kann enzymatisch oder ganz oder 
teilweise chemisch-synthetisch hergestellt werden. 

Bevorzugt wird die dsRNA jedoch ausgehend von entsprechenden Ex- 
30 pressionssystemen in der Zelle exprimiert. Ein weiterer Gegen- 
stand der Erfindung betrif f t ■ besagte dsRNA-Expressionssysteme . 
Wird die dsRNA als ein einzelner, selbstkomplementaren RNA-Strang 
exprimiert, so umfasst das Expressionssystem eine Expressionskas- 
sette mit einer fur den selbstkomplementaren RNA-Strang kodieren- 
35 den DNA Sequenz in funktioneller Verkntipfung mit einen Promotor, 
der geeignet ist, die Expression in der jeweiligen eukaryotischen 
Zelle zu gewahrleisten. Optional kann die Expressionskassette 
weitere funktionelle Elemente wie beispielsweise Transkriptions- 
terminatoren und/oder Polyadenylierungssignale umfassen. Derar- 
40 tige Expressionskassetten sind ebenfalls Gegenstand der Erfin- 
dung. 

Wird die dsRNA in Form von zwei separaten Strangen exprimiert, 
die zueinander ganz oder teilweise komplementar sind, so umfasst 
45 das Expressionssystem zwei Expressionskassetten, wobei jeder der 
beiden Strange in funktioneller Verkmipfung mit einen Promotor 
steht, der geeignet ist, die Expression in der jeweiligen euka- 
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ryotischen Zelle zu gewahrleisten. Optional k6nnen die Expres- 
sionskassetten weitere funktionelle Elemente wie beispielsweise 
Transkriptionsterminatoren und/oder Polyadenylierungssignale urn- 
fassen. Die Kombination der beiden Expressionskassetten zu dem 
5 erf indungsgema&en Expressionssystem kann auf verschiedene dem 
Fachmann geiaufige Art geschehen. Beispielhaft seien zu nennen: 



a) Transformation der Zelle oder Pflanze mit einem Vektor, der 
Expressionskassetten fur beide RNA-Strange umfasst, 

10 

b) Kotrans formation der Zelle oder Pflanze mit zwei Vektoren, 
wobei jeweils ein Vektor ftir jeweils einen der beiden Strange 
der dsRNA kodiert. 



15 c) Kreuzung von zwei Pflanzen, die mit jeweils einem Vektor 

transf ormiert wurden, wobei. jeweils ein Vektor ftir jeweils 
einen der beiden Strange der dsRNA kodiert. 



Es ist auch moglich, das eine Expressionskassette einzusetzten, 
20 bei der die fur die dsRNA kodierende DNA-Sequenz zwischen zwei 
Promotoren mit entgegengerichteter Transkriptionsrichtung lokali- 
siert ist und so von beiden Seiten transkribiert wird. 

Expressionskassette meint chimare DNA-Molekxile in denen eine fur 
25 das dsRNA-Molektil (bzw. ftir einen der Strange desselben) kodie- 
rende Nukleinsauresequenz mit mindestens einem genetischen Kon- 
trollelement (beispielsweise einem Promoter, Enhancer, Silencer, 
Splice-Donor oder -Akzeptor, Polyadenylierungssignal) derart ver- 
kniipft ist, das die Transkription des dsRNA-Molektils (bzw. eines 
30 der Strange desselben) in der eukaryotischen Zelle oder Organis- 
mus gewahrleistet ist. Entsprechend vorteilhaf te Konstruktionen 
sind weiter unten beschrieb. Eine Polyadenylierung ist mdglich, 
jedoch nicht erforderlich, ebenso miissen keine Elemente zur in- 
itiierung einer Translation vorhanden sein. 

35 

Soil das Expressionskonstrukt in eine Pflanze eingefuhrt und die 
dsRNA in plantae erzeugt werdeh, so sind pf lanzenspezif ische ge- 
netische Kontrollelemente (beispielsweise pf lanzenspezif ische 
Promotoren) bevorzugt. Die dsRNA kann jedoch auch in anderen Or- 
40 ganismen oder in vitro erzeugt und dann in die Pflanze einge- 
bracht werden. 

Unter einer funktionellen Verkntipfung versteht man zum Beispiel 
die sequentielle Anordnung eines Promotors mit der zu transkri- 
45 bierenden Nukleinsauresequenz und ggf . weiterer regulativer Ele- 
mente wie zum Beispiel einem Terminator und/oder Polyadenylie- 
rungssignalen derart, dass jedes der regulativen Elemente seine 
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Funktion bei der Transkription der Nukleinsauresequenz, je nach 
Anordnung der Nukleinsauresequenzen erfullen kann. Dazu ist nicht 
unbedingt eine direkte Verkniipfung im chemischen Sinne erf order- 
lich. Genetische Kontrollsequenzen, wie zum Beispiel Enhancer-Se- 
5 quenzen, konnen ihre Funktion auch von weiter entfernten Positio- 
nen oder gar von anderen DNA-Molekiilen aus auf die Zielsequenz 
ausiiben. Bevorzugt sind Anordnungen, in denen die zu transkribie- 
rende Nukleinsauresequenz hinter der als Promoter fungierenden 
Sequenz positioniert wird, so dass beide Sequenzen kovalent mit- 

10 einander verbunden sind. Bevorzugt ist dabei der Abstand zwischen 
der Promotorsequenz und der transgen zu exprimierende Nukleinsau- 
resequenz geringer als 200 Basenpaare, besonders bevorzugt klei- 
ner als 100 Basenpaare, ganz besonders bevorzugt kleiner als 50 
Basenpaare. In einer bevorzugten Aus fuhrungs form wird die zu 

15 transkribierende Nukleinsauresequenz so hinter dem Promotor loka- 
lisiert, das der Transkriptionsstart identisch ist mit dem ge- 
wiinschten Beginn der dsRNA. ■ 

Die Herstellung einer funktionellen Verkniipfung als auch die Her- 
20 stellung einer Expressionskassette kann mittels gangiger Rekom- 
binations- und Klonierungstechniken realisiert werden, wie sie 
beispielsweise in Maniatis T, Fritsch EF und Sambrook J (1989) 
Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Labo- 
ratory, Cold Spring Harbor (NY), in Silhavy TJ, Berman ML und En- 
25 quist LW (1984) Experiments with Gene Fusions, Cold Spring Harbor 
Laboratory, Cold Spring Harbor (NY), in Ausubel FM et al, (1987) 
Current Protocols in Molecular Biology, Greene Publishing Assoc. 
and Wiley Interscience und bei Gelvin et al. (1990) In: Plant Mo- 
lecular Biology Manual beschrieben sind. 

30 

Unter einer Expressionskassette sind aber auch solche Konstruk- 
tionen zu verstehen, bei denen zum Beispiel eine Nukleinsaurese- 
quenz kodierend fur eines dsRNA derart hinter einen endogenen . 
Promotor platziert werden, dass der gleiche Effekt auftritt. 
35 Beide Ansatze fiihren zu Expressionskassetten im Sinne der Effin- 
dung. 

Prinzipiell konnen alle nattlrlichen Promotoren mit ihren Regula- 
tionssequenzen wie die oben genannten fttr das erf indungsgem^sse 
40 Verfahren verwendet werden, solange sie die Expression in dem 

Zielorganismus gewahrleisten. Daruberhinaus konnen auch syntheti- 
sche Promotoren vorteilhaft verwendet werden. 



45 
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Es konnen weitere Promotoren funktionell mit der zu exprimieren- 
den Nukleinsauresequenz verknupft sein, die eine Expression in 
weiteren Eukaryoten oder in Prokaryoten, wie zum Beispiel E.coli 
Bakterien ermoglichen. 

5 

Die in den erf indungsgemassen Expressionskassetten oder Vektoren 
enthaltenen Nukleinsauresequenzen k6nnen mit weiteren genetischen 
Kontrollsequenzen neben einem Promoter funktionell verknupft 
sein. Der Begriff der genetischen Kontrollsequenzen ist breit zu 

10 verstehen und meint all solche Sequenzen, die einen Einfluss auf 
das Zustandekommen oder die Funktion der erf indungsgemassen Ex- 
pressionskassette haben. Genetische Kontrollsequenzen modifizie- 
ren zum Beispiel die Transkription in prokaryotischen oder euka- 
ryotischen Organismen. Vorzugsweise umfassen die erf indungsgemas- 

15 sen Expressionskassetten 5 ' -stromaufwarts von der jeweiligen 

transgen zu exprimierenden Nukleinsauresequenz einen pflanzenspe- 
zifischen Promoter und 3 ' -stromabwarts eine Terminatorsequenz als 
zusatzliche genetische Kontrollsequenz , sowie gegebenenf alls wei- 
tere ubliche regulative Elemente, und zwar jeweils funktionell 

20 verknupft mit der transgen zu exprimierenden Nukleinsauresequenz . 

Genetische Kontrollsequenzen umfassen ferner auch die 5'-untrans- 
latierte Regionen, Introns oder nichtkodierende 3 '-Region von Ge- 
nen. Es ist gezeigt worden, dass diese eine signifikante Funktio- 
25 nen bei der Regulation der Genexpression spielen kSnnen. Kon- 
trollsequenzen umfassen ferner Polyadenylierungssignale sowie 
Terminatorsequenzen . 

Die Expressionskassette kann vorteilhaf terweise eine oder mehrere 
30 sogenannte "enhancer Sequenzen" funktionell verkntipft mit dem 

Promoter enthalten, die eine erhohte transgene Expression der Nu- 
kleinsauresequenz ermoglichen. Auch am 3'-Ende der transgen zu 
exprimierenden Nukleinsauresequenzen k6nnen zusatzliche vorteil- 
hafte Sequenzen inseriert werden, wie weitere regulatorische Ele- 
35 mente oder Terminatoren. Die transgen zu exprimierenden Nuklein- 
sauresequenzen konnen in einer oder mehreren Kopien im Genkon- 
strukt enthalten sein. 

Als Kontrollsequenzen sind weiterhin solche zu verstehen, die 
40 eine homologe Rekombination bzw. Insertion in das Genom eines 

Wirtsorganismus ermoglichen oder die Entfernung aus dem Genom er- 
laxiben. Methoden wie die cre/lox-Technologie erlauben eine gewe- 
bespezifische, unter Umstanden induzierbare Entfernung der Ex- 
pressionskassette aus dem Genom des Wirtsorganismus (Sauer B ■ 
45 (1998) Methods. 14 (4) : 381-92 ) . Hie r werden best immte f lankier ende 
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Sequenzen dem Zielgen angefugt (lox-Sequenzen) , die spater eine 
Entfernung mittels der cre-Rekombinase ermoglichen. 

Bevorzugt kann die Express ions kassette, bestehend aus einer Ver- 
5 knxipfung von Promoter und zu transkribierender Nukleinsaurese- 
quenz, integriert in einem Vektor vorliegen und durch zura Bei- 
spiel Transformation - nach einem der unten beschriebenen Verfah- 
ren - in die eukaryotische Zelle oder Organismus eingebracht wer- 
den. Die nachfolgende Expression kann transient sein oder aber 

10 auch - bevorzugt - stabil nach Insertion (beispielsweise unter 
Verwendung von Selektionsmarkern) der Expressionskassetten in das 
Genom erfolgen. Bevorzugt wird das dsRNA-Expressionssystem stabil 
in das Genom - beispielsweise die chromosomale DNA oder die DNA 
der Organellen (z.B. der Plastiden, Mitochondrien etc.) - einer 

15 Zelle integriert. 

Die Einfiihrung einer erf indungsgem&ssen transgenen Expressions- 
kassette in einen Organismus oder Zellen, Geweben, Organe, Teile 
bzw. Samen desselben (bevorzugt in Pflanzen bzw. pflanzliche Zel- 

20 len, Gewebe, Organe, Teile oder Samen) kann vorteilhaft unter 
Verwendung von Vektoren realisiert werden, in denen die transge- 
nen Expressionskassetten enthalten sind. Vektoren k6nnen bei- 
spielhaft Plasmide, Cosmide, Phagen, Viren oder auch Agrobakte- 
rien sein. Die transgenen Expressionskassetten konnen in den Vek- 

25 tor (bevorzugt ein Plasmidvektor ) tiber eine geeignete Restrikti- 
onsschnittstelle insertiert werden. Der entstandene Vektor wird 
zunachst in E.coli eingefiihrt. Korrekt trans formierte E.coli wer- 
den selektioniert , geziichtet und der rekombinante Vektor mit dem 
Fachmann gelSufigen Methoden gewonnen. Restriktionsanalyse und 

30 Sequenzierung konnen dazu dienen, den Klonierungsschritt zu iiber- 
priifen. Bevorzugt sind solche Vektoren, die eine stabile Integra- 
tion der Expressionskassette in das Wirtsgenom ermoglichen. 

Die Herstellung eines trans formier ten Organismus (bzw. einer 
35 transformierten Zelle oder Gewebes) erfordert, dass die entspre- 
chende DNA (z.B. der Express ions vektor) oder RNA in die entspre- 
chende Wirtszelle eingebracht wird. Fur diesen Vorgang, der als 
Transformation (oder Transduktion bzw. Transf ektion) bezeichnet 
wird, steht eine Vielzahl von Methoden zur Verfvigung (Keown et 
40 al. (1990) Methods in Enzymology 185:527-537). So kann die DNA 
oder RNA beispielhaft direkt durch Mikroinj ektion oder durch Bom- 
bardierung mit DNA-beschichteten Mikropartikeln eingefiihrt wer- 
den. Auch kann die Zelle chemisch, zum Beispiel mit Polyethylen- 
glycol, permeabilisiert werden, so dass die DNA durch Diffusion 
45 in die Zelle gelangen kann. Die DNA kann auch durch Protopla- 
stenfusion mit anderen DNA-enthaltenden Einheiten wie Minicells, 
Zellen, Lysosomen oder Liposomen erfolgen. Elektroporation ist 
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eine weitere geeignete Methode zur Einfuhrung von DNA, bei der 
die Zellen reversibel durch einen elektrischen Impuls permeabili- 
sert werden. Entsprechende Verfahren sind beschrieben (beispiels- 
weise bei Bilang et al. (1991) Gene 100:247-250; Scheid et al. 
5 (1991) Mol Gen Genet 228:104-112; Guerche et al. (1987) Plant 
Science 52:111-116; Neuhause et al. (1987) Theor Appl Genet 
75:30-36; Klein et al. (1987) Nature 327:70-73; Howell et al. 
(1980) Science 208:1265; Horsch et al. (1985) Science 
227:1229-1231; DeBlock et al . (1989) Plant Physiology 91:694-701; 
10 Methods for Plant Molecular Biology (Weissbach and Weissbach, 
eds.) Academic Press Inc. (1988); and Methods in Plant Molecular 
Biology (Schuler and Zielinski, eds.) Academic Press Inc. 
(1989)). 

15 Ein weiterer Gegenstand der Erfindung betrifft Zellen, die eines 
der erfindungsgema&en dsRNA Molekule, Expr ess ionssyst erne, Expres- 
sionskassetten oder Expressionsvektoren enthalten. Die Zelle kann 
von einem Organismus abgeleitet oder in diesem enthalten sein, 
meint aber auch einzellige Organismen wie Mikroorganismen. Die 

20 Zelle kann prokaryotisch oder eukarypotischer Natur sein. Wobei 
das erf indungsgemaSe Verfahren auf eukaryotische Organismen ange- 
wendet wird. Dennoch k5nnen prokaryotische Organismen die erfin- 
dungsgemafcen Expressionssysteme beispielsweise zum Zwecke der 
dsRNA-Produktion enthalten. Auch k6nnen prokaryotische Organis- 

25 men, beispielsweise Agrobakterien, vorteilhaft als Vehikel fttr 
die Transformation beispielsweise- pflanzlicher Organismen einge- 
setzt werden. 

Bevorzugte Prokaryoten sind vor allem Bakterien wie Bakterien der 
30 Gattung Escherichia, Corynebacterium, Bacillus, Clostrridium, 

Proionibacterium, Butyrivibrio, • Eubactefium, Lactobacillus, Erwi- 
nia, Agrobacteri\am, Flavobacterium, Alcaligenes, Phaeodactylum, 
Colpidium, Mortierella, Entomophthora, Mucor, Crypthecodinium 
oder Cyanobakterien zum Beispiel der Gattung Synechocystis . Be- 
35 vorzugt sind vor allem Mikroorganismen, welche zur Infektion von 
Pflanzen und damit zur ttbertragung der erf indungsgemassen Kon- 
strukte befahigt sind. Bevorzugte Mikroorgani sinus sind solche aus 
der Gattung Agrobacterium und insbesondere der Art Agrobacterium 
tumefaciens. 

40 

Eukaryotische Zellen und Organismen umfasst pflanzliche und tie- 
rische, nicht-menschliche Organismen und/oder Zellen sowie euka- 
ryotische Mikroorganismen wie beispielsweise Hefen, Algen oder 
Pilze. Eine entsprechender transgener Organismus kann beispiels- 
45 weise durch Einftihrung der entsprechenden Expressionssysteme in 
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eine Zygote, Stammzelle, Protoplast oder eine andere geeignete 
von dem Organismus abgeleitete Zelle hergestellt werden. 

"Tierische Organismus" meint nicht-menschliche Vertebraten oder 
5 Invertebraten. Bevorzugte Vertebraten umfassen beispielsweise Fi- 
scharten, nicht-menschliche Saugetiere wie Rind, Pferd, Schaf , 
Ziege, Maus, Ratte oder Schwein, sowie Vogel wie Huhn cider Gans. 
Bevorzugte tierische Zellen umfasseil CHO, COS, HEK293 Zellen. In- 
vertebraten umfassen Nematoden oder andere warmer sowie Insekten. 
10 Invertebraten umfassen Insektenzellen wie Drosophila S2 und Spo- 
doptera Sf9 oder Sf21 Zellen. 

Bevorzugt sind ferner Nematoden, die in der Lage sind Tiere oder 
Menschen zu befallen, wie solche der Gattungen Ancylostoma, Asca- 

15 ridia, Ascaris, Bunostomum, Caenorhabditis, Capillaria, Chaber- 
tia, Cooperia, Dictyocaulus , Haemonchus, Heterakis, Nematodirus, 
Oesophagostomum, Ostertagia, Oxyuris, Parascaris, Strongylus, To- 
xascaris, Trichuris, Trichostrongylus, Tfhchonema, Toxocara oder 
Uncinaria. Ferner bevorzugt sind solche, die in der Lage sind " 

20 pflanzliche Organismen zu befallen wie beispielsweise Bursapha- 
lenchus, Criconemella, Diiylenchus, Ditylenchus, Globodera, Heli- 
cotylenchus, Heterodera, Longidorus, Melodoigyne, Nacobbus, Para- 
tylenchus, Pratylenchus , Radopholus, Rotelynchus, Tylenchus oder 
Xiphinema. Bevorzugte Insekten umfassen solche der Gattungen Co- 

25 leoptera, Diptera, Lepidoptera und Homop.tera. 

Bevorzugte Pilze sind Aspergillus, Trichoderma, Ashbya, Neu- 
rospora, Fusarium, Beauveria oder weitere in Indian Chem Engr. 
Section B. Vol 37, No 1,2 (1995) auf Seite 15, Tabelle 6 be- 
30 schriebene Pilze. Besonders bevorzugt ist der filamentose Hemia- 
scomycet Ashbya gossypii. ■ ■ 

Bevorzugte Hefen sind Candida, Saccharomyces , Hansenula oder Pi- 
chia, besonders bevorzugt sind Saccharomyces cerevisiae oder Pi- 
35 chia pastoris (ATCC Accession No. 201178). 

Als transgene Organismen bevorzugt sind vor allem pflanzliche Or- 
ganismen. "Pflanzlicher Organismus" umfasst jeden Organismus, der 
zur Photosynthese befahigt ist, sowie die von diesem abgeleitete 

40 Zellen, Gewebe, Teile oder Vermehrungsgut (wie Samen oder 

Friichte) . Eingeschlossen sind im Rahmen der Erfindung alle Gat- 
tungen \ind Arten hoherer und niedrigerer Pflanzen des Pflanzen- 
reiches. Einjahrige, mehrjahrige, monocotyledone und dicotyledone 
Pflanzen sowie Gymnospermen sind bevorzugt. Eingeschlossen sind 

45 reife Pflanze, Saatgut, Sprosse und Keimlinge, sowie davon abge- 
leitete Teile, Vermehrungsgut (zum Beispiel Knollen, Samen oder 
Fruchte) und Kulturen, zum Beispiel Zell- oder Kalluskulturen. 
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Reife Pflanzen meint Pflanzen zu jedera beliebigen Entwicklungs- 
stadium jenseits des Keimlings. Keimling meint eine junge, un- 
reife Pflanze in einem fruhen En t wi c klung s s t adium . 

5 "Pflanze" im Rahmen der Erfindung meint alle Gattungen und Arten 
hSherer und niedrigerer Pflanzen des Pf lanzenreiches . Einge- 
schlossen vmter dem Begriff sind die reifen Pflanzen, Saatgut, 
Sprossen und Keimlinge, sowie davon abgeleitete Teile, Vermeh- 
rungsgut, Pf lanzenorgane, Gewebe, Protoplasten, Kallus und andere 

10 Kulturen, zum Beispiel Zellkulturen, sowie alle anderen Arten von 
Gruppierungen von Pf lanzenzellen zu funktionellen oder struktu- 
rellen Einheiten. Reife Pflanzen meint Pflanzen zu jedem beliebi- 
gen Entwicklungsstadium jenseits des Keimlings. Keimling meint 
eine junge, unreife Pflanze in einem friihen Entwicklungsstadium. 

15 "Pflanze" umfasst alle einj&hrigen und mehrjahrige, monokotyledo- 
nen und dikotyledonen Pflanzen und schlieSt beispielhaft jedoch 
nicht einschrankend solche der Gattungen Cucurbita, Rosa, Vitis, 
Juglans, Fragaria, Lotus, Medicago, Onobrychis, Trifolium, Trigo- 
nella, Vigna, Citrus, Linum, Geranium, Manihot, Daucus, Arabidop- 

20 sis, Brassica, Raphanus, Sinapis, Atropa, Capsicum, Datura, Hyo- 
scyamus, Lycopersicon, Nicotiana, Solarium, Petunia, Digitalis, 
Major ana, Ciahorium, Helianthus, Lactuca, Bromus, Asparagus, An- 
tirrhinum, Heterocallis, Nemesis, Pelargonium, Panieum, Pennise- 
turn, Ranunculus, Senecio, Salpiglossis, Cucumis, Browaalia, Gly- 

25 cine, Pisum, Phaseolus, Lolium, Oryza, Zea, Avena, Hordeum, Se- 
cale, Triticum, Sorghum, Picea und Populus ein. 

Bevorzugt sind Pflanzen nachf olgender Pf larizenfamilien: Amarant- 
haceae, Asteraceae, Brassicaceae, Carophyllaceae, Chenopodiaceae , 
30 Compositae, Cruciferae, Cucurbitaceae, Labiatae, Leguminosae, Pa- 
pilionoideae, Liliaceae, Linaceae, Malvaceae, Rosaceae, Rubia- 
ceae, Saxifragaceae, Scrophulariaceae, Solanacea, Sterculiaceae, 
Tetragoniacea , Theaceae , Umbellif erae . 

35 Bevorzugte monokotyle Pflanzen sind insbesondere ausgewahlt aus 
den monokotylen Kulturpf lanzen, wie zum Beispiel der Familie der 
Gramineae wie Alfalfa, Reis, Mais, Weizen oder andere Getreidear- 
ten wie Gerste, Hirse, Roggen, Triticale oder Hafer sowie dem 
Zuckerrohr sowie alle Arten von Grasern. 



Die Erfindung wird ganz besonders bevorzugt aus dikotyledone 
pflanzliche Organismen angewendet. Bevorzugte dikotyle Pflanzen 
sind insbesondere ausgewahlt aus den dikotylen Kulturpf lanzen, 
wie zum Beispiel 




40 
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- Asteraceae wie Sonnenblume, Tagetes oder Calendula und andere 
mehr, 

- Compositae, besonders die- Gattung Lactuca, ganz besonders die • 
5 Art sativa (Salat) und andere mehr, 

- Cruciferae, besonders die Gattung Brassica, ganz besonders die 
Arten napus (Raps) , campestris (Rube) , oleracea cv Tastie 
(Kohl), oleracea cv Snowball Y (Blumenkohl) und oleracea cv Em- 

10 peror (Broccoli) und weitere Kohlarten; und der Gattung Arabi- 
dopsis, ganz besonders die Art thaliana sowie Kresse oder Ca- 
nola und andere mehr, 

Cucurbitaceae wie Melone, Kurbis oder Zucchini und andere mehr, 

Leguminosae besonders die Gattung Glycine, ganz besonders die 
Art max (Sojabohne) Soja sowie Alfalfa, Erbse, Bohnengewachsen 
oder Erdnuss und andere mehr 

20 - Rubiaceae, bevorzugt der Unterklasse Lamiidae wie beispiels- 
weise Coffea arabica oder Coffea liberica (Kaf f estrauch) und 
andere mehr, 

- Solanaceae besonders die Gattung Lycopersicon, ganz besonders 
25 die Art esculentum (Tomate) und die Gattung Solanum, ganz be- 
sonders die Art tuberosum (Kartoffel) und melongena (Aubergine) 
sowie Tabak oder Paprika und andere mehr, 

- Sterculiaceae , bevorzugt der Unterklasse Dilleniidae wie bei- 
30 spielsweise Theobroma cacao (Kakaostrauch) und andere mehr, 

- Theaceae, bevorzugt der Unterklasse Dilleniidae wie beispiels- 
weise Camellia sinensis oder Thea sinensis (Teestrauch) .und an- 
dere mehr, 

35 

- Umbelliferae, besonders die Gattung Daucus (ganz besonders die 
Art carota (Karrotte) ) und Apium (ganz besonders die Art gra- 
veolens dulce (Selarie) ) und andere mehr; und die Gattung Cap- 
sicum, ganz besonders die Art annum (Pfeffer) und andere mehr, 

40 

sowie Lein, Soya, Baumwolle, Hanf, Flachs, Gurke, Spinat, Mohre, 
Zuckerrtibe und den verschiedenen Baum-, Nuss- und Weinarten, ins- 
be sondere Banane und Kiwi . 

45 Umfasst sind ferner Schmuckpf lanzen, Nutz- oder Zierbaume, Blu- 
men, Schnittblumen, Straucher oder Rasen. Beispielhaft aber nicht 
einschrankend seien zu nennen Angiospermen, Bryophyten wie zum 
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Beispiel Hepaticae (Leberblumchen) und Musci (Moose); Pteridophy- 
ten wie Fame, Schachtelhalm und Lycopoden; Gymnospermen wie Ko- 
niferen, Cycaden, Ginkgo und Gnetalen, die Familien der Rosaceae 
wie Rose, Ericaceae wie Rhododendrons und Azaleen, Euphorbiaceae 
5 wie Weihnachts sterne und Kroton, Caryophyllaceae wie Nelken, So- 
lanaceae wie Petunien, Gesneriaceae wie das Usambaraveilchen, 
Balsaminaceae wie das Springkraut, Orchidaceae wie Orchideen, 
Iridaceae wie Gladiolen, Iris, Preesie und Krokus, Coinpositae wie 
Ringelblume, Geraniaceae wie Geranien, Liliaceae wie der Drachen- 
10 baum, Moraceae wie Ficus, Araceae wie Philodendron und andere * 
mehr . 

Pflanzliche Organisraen im Sinne der Erfindung sind weiterhin wei- 
tere photosynthetisch aktive befahigte Organismen, wie zum Bei- 
15 spiel Algen, Cyanobakterien sowie Moose. Bevorzugte Algen sind 
Grtinalgen, wie beispielsweise Algen der Gattung Haematococcus , 
Phaedactylum tricornatum, Volvox oder Dunaliella. Insbesondere 
bevorzugt ist Synechocystis . 

20 Am meisten bevorzugt sind 

a) Pflanzen, die zur Olproduktion geeignet sind, wie beispiels- 
weise Raps, Sonnenblume , Sesam, Farberdistel (Carthamus tinc- 
torius), Olbaum, Soja, Mais, ErdnuS, Rizinus, Olpalme, Wei- 
25 zen, Kakaostrauch oder verschiedene Nussarten wie beispiels- 

weise Walnuss, KokosnuS oder Mandel. Unter diesen wieder be- 
sonders bevorzugt sind dikotyledonen Pflanzen, insbesondere 
Raps, Soja und Sonnenblume. 

30 b) Pflanzen, die der Starkeproduktion dienen, wie beispielsweise 
Mais, Weizen oder Kartoffel. 

c) Pflanzen, die als Nahrungs- und/oder Futtermittel und/ oder 

• Nutzpflanze genutzt werden und bei denen eine Resistenz gg. 
35 Pathogene vorteilhaft ware, wie beispielsweise Gerste, Rog- 

gen, Reis, Kartoffel, Baumwolle, Flachs, Lein. 

d) Pflanzen, die zur Produktion von Feinchemikalien wie bei- 
spielsweise Vitaminen und/oder Carotinoiden dienen konnen, 

40 wie beispielsweise Raps. 

Die in den Verfahren verwendeten Organismen werden je nach Wirts- 
organismus in dem Fachmann bekannter Weise angezogen bzw. geztich- 
tet. Mikroorganismen werden in der Regel in einem fliissigen Me- 
45 dium, das eine Kohlenstof fquelle meist in Form von Zuckern, eine 
Stickstof fquelle meist in Form von organischen Stickstof fquellen 
wie Hefeextrakt oder Salzen wie Ammoniumsulf at , Spurenelemente 
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wie Eisen-, Siangan-, Magnesiumsalze und gegebenenf alls Vitamine 
enthalt, bei Temperaturen zwischen 0°C und 100°C, bevorzugt zwi- 
schen 10°C bis 60°C unter Sauerstof fbegasung angezogen. Dabei kann 
der pH der Nahrf lussigkeit auf einen festen Wert gehalten werden, 
das heiSt wahrend der Anzucht reguliert werden oder nicht. Die 
Anzucht kann batch weise, semi batch weise oder kontinuierlich 
erfolgen. Nahrstoffe konnen zu beginn der Fermentation vorgelegt 
oder semikontinuierlich oder kontinuierlich nach gefiittert wer- 
den. 



10 



Nachfolgende Anwendung des erf indungsgema&en Verfahrens seien 
beispielhaft jedoch nicht einschrankend zu nennen: 

I . Pf lanzenbiotechnologie 



15 



Bevorzugt wird das erf indungsgemafie. Verfahren im Rahmen der 
Pflanzenbiotechnologie zur Erzeugung von Pflanzen mit vorteilhaf- 
ten Eigenschaften eingesetzt. So kann Eignung der Pflanzen oder 
deren Samen als Nahrungs- oder Futtermittel verbessert werden, 
20 beispielsweise iiber eine Veranderung der Zusammensetzungen und/ 
oder des Gehalt an Metaboliten, insbesondere Proteinen, Slen, Vi- 
taminen und/oder Starke. Auch k6nnen Wachstumsrate, Ertrag oder 
die Resistenz gegen biotische oder abiotische Stressfaktoren er- 
hoht werden. Nachfolgende Anwendungen im Bereich der Pflanzenbio- 
25 technologie sind insbesondere vorteilhaft. Die angegebenen mogli- 
chen Zielgene sind beispielhaft jedoch nicht einschrankend zu 
verstehen: 

1. Verbesserter Schutz gegen abiotische Stressfaktoren (Hitze, 
30 Kalte, Trockenheit , erhohte Feuchtigkeit , Umweltgifte, UV- 

Strahlung) . Bevorzugt werden Gene in iherer Expression ver- 
mindert, die am Stressreaktionen beteiligt sind. 

2. Modifikation der Zusammensetzung und/oder des Gehaltes an 
35 Fettsauren, Lipiden oder Olen 

Eine Veranderung des Fettsauregehalten oder der Fettsaurezu- 
saramensetzung, vorzugsweise in einer Olfrucht wie Raps oder 
Sonnenblume, kann beispielsweise erreicht werden durch Ver- 

40 minderung der Genexpression von Genen der Fettsaurebiosynt- 

hese vorzugsweise ausgewahlt aus der Gruppe bestehend aus Ge- 
nen kodierend f\ir Acetyltransacylasen, Acyltransportproteinen 
("acyl carrier protein"), Desaturasen wie Stearyldesaturasen 
oder iciikrosomale A12-Desaturasen insbesondere Fad2-1 Gene, 

45 Malonyltransacylase, p-Ketoacyl-ACP-synthetasen, 3-Keto-ACP- 

reduktasen, Enoyl-ACP-hydrasen, Thioesterasen wie Acyl-ACP- 
thioesterases , Enoyl-ACP-reduktasen. Verschiedene weitere vor- 
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teilhafte Ansatze zur Modif izierung der Lipidzusammensetzung 
sind beschrieben (Shure M et al. (1983) Cell 35:225-233; 
Preiss et al. (1987) Tailoring Genes for Crop Improvement 
(Bruening et al., eds.), Plenum Press, S. 133-152; Gupta et 
5 al. (1988) Plant Mol Biol. 10:215-224; Olive et al. (1989) 

Plant Mol- Biol 12:525-538; Bhattacharyya et al. (1990) Cell 
60:155-122; Dunwell JM (2000) J Exp Botany SISpec No:487-96; 
Brar DS et al. (1996) Biotech Genet Eng Rev 13:167-79; Kis- 
hore GM und Somerville CR (1993) Curr Opin Biotech 

10 4(2): 152-8). Bevorzugt sind insbesondere Fad2 Gene (z.B. be- 

schrieben durch Genbank Acc.-Nr.: AF124360 (Brassica cari- 
nata) , AF042841 (Brassica rapa) , L26296 (Arabidopsis tha- 
liana), A65102 (Corylus avellana) ) . Weitere vorteilhafte Gene 
und Verfahren zur Modif ikation des Lipidgehaltes sind bei-. 

15 spielsweise beschrieben in US 5,530,192 und WO 94/18337. Ein 

erhShter Lipidgehalt kann auch erreicht werden durch Vermin- 
derung des Starkegehalte bespielsweise infolge verminderter 
Expression von von Enzymen des Kohlenhydratstof fwechsels 
(z.B. ADP-Glucosepyrophosphorylasen) . 

20 

3 . Modif ikation der Kohlenhydratzusammensetzung 

Eine Modifikation der Kohlehydratzusammensetzung kann bei- 
spielsweise erreicht werden durch Verminderung der Genexpres- 

25 sion von Genen des Kohlenhydratstof fwechsels oder der Kohlen- 

hydratbiosynthese, beispielsweise der Biosynthese von Amy- 
lose, Pektinen, Cellulose oder Zellwandkohlenhydraten. Da- 
durch kann eine Vielzahl zellularer Prozesse (Reifung, Halfe- 
stigkeit, Starkezusammensetzung oder -gehalt etc.) in vor- 

30 teilhafter Weise beeinflusst werden. Als Zielgene seien bei- 

spielhaft jedoch nicht einschrankend zu nennen Phosphoryla- 
sen, Starkesynthetasen, Q-Enzyme, Sucrose- 6-phosphatsyntheta- 
sen, Sucrose-6-phosphatphosphatasen, ADP-Glucosepyrophospho- 
rylasen, Branching-Enzyme, D'ebranching-Enzyme sowie diverse 

35 Amylasen. Die entsprechenden Gene sind beschrieben (Dunwell 

JM (2000) J Exp Botany 51Spec No: 487-96; Brar DS et al. 
(1996) Biotech Genet Eng Rev 13:167-79; Kishore GM und Somer- 
ville CR (1993) Curr Opin Biotech 4(2) :152-8) . Vorteilhafte 
Gene zur beeinf lussung des Kohlenhydratstof fwechsels - insbe- 

40 sondere der Starkebiosynthese - sind beschrieben in WO 

92/11375, WO 92/11376, US 5, 365,016 und WO 95/07355. 

4. Veranderung der Farbe oder Pigmentierung 

45 Veranderung der Farbe oder Pigmentierung vorzugsweise von 

Zierpflanzen kann beispielsweise erreicht werden durch Ver- 
minderung der Genexpression von Genen der Flavonoid-Biosynt- 
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hese wie beispielsweise Chalconsynthasen, Chalconisomerasen, 
Phenylalaninaramonialyasen , Dehydrokaempf erol ( f lavone ) hydroxy- 
lasen wie Flavanon-3-hydroxylasen oder Flavanon-2-hydroxyla- 
sen, Dihydrof lavonolreduktasen, Dihydrof lavanol-2-hydroxyla- 
5 sen, Flavonoid-3 ' -hydroxy las en, Flavonoid-5 1 -hydroxylasen , 

Flavonoidglycosyltransferasen (z.B. Glucosyl trans f erasen wie 
UDPG: Flavonoid- 3 -0 -glucosyl trans f erasen, UDPG:Flavo- 
nol-7-0-glucosytransf erasen oder Rhamnosyl trans f erasen) , Fla- 
vonoidme thyl trans f erasen ' (wie z.B. SAM: Anthocyani- 

10 din-3- (p-coumaroyl) -rutinosid-5-glucosid-3 ' , 5 ' -O-methyltrans- 

f erasen) und Flavonoidacyl trans f erasen (Hahlbrock (1981) Bio- 
. chemistry of Plants, Vol.7, Conn (Ed.); Weiring and de Vla- 
ming (1984) * Petunia" , KC Sink (Ed.), Springer-Ver lag , New 
York) . Geeignet sind insbesondere die in EP-A1 522 880 be- 

15 schriebenen Sequenzen. 

5 . Verminderung des Gehaltes von Speicherproteinen 

Die Verminderung der Genexpression von Genen kodierend fur 
20 Speicherproteine (infolge SP) hat zahlreiche Vorteile, wie 

beispielsweise Verminderung des allergenen Potentials oder 
Veranderung in der Zusammensetzung oder Menge anderer Metabo- 
lite. Speicherproteine sind u.a beschrieben in EP-A 0 591 
530, WO 8.7/47731, WO 98/26064, EP-A 0 620 281; Kohno-Murase J 
25 et al. (1994) Plant Mol Biol 26(4): 1115-1124. 

SP dienen zur Speicherung von Kohlenstoff , Stickstoff und 
Schwefel, die fur das schnelle heterotrophe Wachstum bei Kei- 
mung von Samen oder Pollen benotigt werden. Sie haben meist 
30 keine enzymatische Aktivitat. SP werden dabei nur im Embryo 

wahrend der Samenentwicklung synthetisiert und akkumulieren 
dabei zum einen in Proteinspeichervakuolen (PSV) von unter- 
schiedlich dif f erentzierten Zellen im Embryo bzw. Endosperm. 

35 "Speicherprotein" meint allgemein ein Protein, das mindestens 

eine der nachf olgenden wesentlichen Eigenschaf ten aufweist: 

i) Speicherproteine werden im wesentlichen nur im Embryo 
wahrend der Samenentwicklung exprimiert. w Im wesentli- 
40 chen" bedeutet dabei, dass in dem besagten Stadium minde- 

stens 50%, bevorzugt mindestens 70%, ganz besonders be- 
vorzugt mindestens 90%, am meisten bevorzugt mindestens 
95% der Gesamtexpression liber die Lebensdauer einer 
Pflanze hinweg stattfindet. 



45 
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ii) Speicherproteine werden wahrend der Keimung des Samen 
wieder abgebaut. Dabei betragt der Abbau wahrend der Kei- 
mung mindestens 20%, bevorzugt mindestens 50%, ganz be- 
sonders bevorzugt mindestens 80%. 

5 

iii) Speicherproteine machen einen wesentlichen Anteil am Ge- 
samtproteingehalt des nicht-keimenden Samens aus. Bevor- 
zugt macht das Speicherprotein in dem nicht-keimenden Sa- 
men der Wildtyp-Pf lanze mehr als 5 Gew.% des Gesaratpro- 

10 teins aus, besonders bevorzugt mindestens 10 Gew.%, ganz 

besonders bevorzugt mindestens 20 Gew.%, am meisten be- 
vorzugt mindestens 30 Gew.-%. 

Bevorzugt weisen Speicherproteine 2 oder alle der oben ge- 
15 nannten wesentlichen Eigenschaften i), ii) oder iii) auf. 

Speicherproteine konnen in Untergruppen entsprechend weiterer 
charakteristischer Eigenschaften, wie beispielsweise ihrem 
Sedimentationskoef fizienten oder der Loslichkeit in verschie- 
20 denen Losungen (Wasser, Salzlosung, Alkohol) aufgeteilt wer- 

den. Die Bestimmung des Sedimentationskoef fizienten kann in 
der dem Fachmann vertrauten Weise mittels Ultrazentrifugation 
durchgefuhrt werden (z.B. beschrieben bei Correia JJ (2000) 
Methods in Enzymology 321:81-100). 

25 

Insgesamt k6nnen vier grosse Genfamilien fur Speicherproteine 
aufgrund ihrer Sequenzen zugeordnet werden: 2S-Albumine (Na- 
pin-ahnlich) , 7S-Globuline (Phaseolin-ahnlich) , llS/12S-Glo- 
buline (Legumin-/Crucif erin-ahnlich) und die Zein- Prolamine . 

30 

2S Albumine sind weit verbreitet in Samen von Dikotyledonen, 
einschliesslich wichtiger kommerzieller Pf lanzenf amilien wie 
Fabaceae (z.B. Sojabohne) , Brassicaceae (z.B. Raps), Euphor- 
biaceae (z.B. Rizinus) oder Asteraceae (z.B. Sonnenblume) . 2S 
35 Albumine sind kompakte globulare Proteine mit konservierten 

Cysteinresten, die oft Heterodimere bilden. 

7S-Globuline liegen in trimerer Form vor und enthalten keine 
Cysteinreste. Nach ihrer Synthese werden sie wie die 2S-Albu- 

40 mine in kleinere Fragmente gespalten und glykosyliert . Trotz 

Unterschiede in der Polypeptidgrosse sind die verschiedenen 
7S-Globuline hoch konserviert und gehen vermutlich wie die 
2S-Albumine auf einen gemeinsames Vorlauf erprotein zurQck. 
Die 7S-Globuline sind nur in geringen Mengen in Monokotyledo- 

45 nen vorhanden. In Dikotyledonen ist ihr Anteil immer kleiner 

verglichen mit den llS/12S-Globulinen. 
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llS/12S-Globuline stellen neben den 2S-Albuminen die Haupt- 
fraktion der Speicherproteine in Dikotyledonen. Die hohe Ahn- 
lichkeit der verschiedenen HS-Globuline aus verschiedenen 
Pf lanzengattungen lassen wiederrum auf einen gemeinsames Vor- 
5 lauf erprotein in der Evolution schliessen. 

Bevorzugt ist das Speicherprotein ausgewahlt aus den Klassen 
der .2S-Albumine (Napin-ahnlich) , 7S-Globuline ( Phased in-ahn- 
lich) , llS/12S-Globuline (Legumin-VCrucif erin-ahnlich) oder 
10 Zein- Prolamine. 

Besonders bevorzugte 2S-Albumine umfassen 



i) 2S-Albumine aus Arabidopsis, ganz besonders bevorzugt die 
15 2S-Albumine mit der SEQ ID NO: 2, 4, 6 oder 8, am meisten 

bevorzugt die durch die Nukleinsauren gemafi SEQ ID NO: 1, 
3, 5 oder 7 kodierten Proteine, 

ii) 2S-Alburaine aus Arten der Gattung Brassica, wie bei- 

20 spielsweise Brassica napus, Brassica nigra, Brassica jun- 

cea, Brassica oleracea oder Sinapis alba, ganz besonders 
bevorzugt die 2S-Albumine mit der SEQ ID NO: 32, 34, 36, 
38, 40, 46 oder 48, am meisten bevorzugt die durch die 
Nukleinsauren gemafi SEQ ID NO: 31, 33, 35, 37, 39, 45 

25 oder 47 kodierten Proteine, 

iii) 2S-Albumine aus Soja, ganz besonders bevorzugt die 2S-A1- 
bumine mit der SEQ ID NO: 42 oder 44, am meisten bevor- 
zugt die durch die Nukleinsauren gemafi SEQ ID NO: 41 oder 

30 43 kodierten Proteine, 

iv) 2S-Albumine aus Sonnenblume (Helianthus annus), ganz be- 
sonders bevorzugt die 2S-Albumine mit der SEQ ID NO: 50 
oder 52, am meisten bevorzugt die durch die Nukleinsauren 

35 gemaS SEQ ID NO: 49 oder 51 kodierten Proteine, 

sowie die entsprechenden Homologen und funktionellen Aquiva- 
lente zu i) oder ii) oder iii) oder iv) aus identischen oder 
anderen Pf lanzfenarten, insbesondere Raps, Sonnenblume, Lein, 
40 Sesam, Farberdistel, Olbaum, Soja oder verschiedene Nussar- 

ten. Funktionelle Aquivalente zeichnen sich bevorzugt neben 
den oben genannten wesentlichen Eigenschaf ten durch charakte- 
ristische Eigenschaften wie einen 2S-Sedimentationskoef f i- 
zienten und/oder durch eine Loslichkeit in Wasser aus. 



45 
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Funktionelle Aquivalente der 2S-Albumine haben in' einer wei- 
teren bevorzugten Ausfuhrungsf orm eine Homologie von minde- 
stens 60%, bevorzugt mindestens 80%, ganz besonders bevorzugt 
mindestens 90%, am meisten bevorzugt mindestens 95% zu einer 
5 der Proteinsequenzen mit der SEQ ID NO: 2, 4, 6, 8, 32, 34, 

36, 38, 40, 42, 44, 46, 48, 50 oder 52 wobei die Homologie 
sich bevorzugt liber eine Lange von mindestens 30 Aminosauren, 
bevorzugt mindestens 50 Aminosauren besonders bevorzugt uber 
100 Aminosauren, am meisten bevorzugt tiber die gesamte Lange 
10 der jeweiligen Proteine erstreckt, und weisen die gleichen 

wesentlichen Eigenschaf ten eines Speicherproteins und - be- 
vorzugt- die charakteristischen Eigenschaf ten eines 2S-Spei- 
cherproteins auf. 

15 Besonders bevorzugte 7S-Globuline umfassen solche aus Arabi- 

dopsis oder Soja, ganz besonders bevorzugt die Proteine mit 
der SEQ ID NO: 94 oder 96, am meisten bevorzugt die durch die 
Nukleinsauren gemafc SEQ ID NO: 93 oder 95 kodierten Proteine. 
Funktionelle Aquivalente zeichnen sich bevorzugt neben den 

20 oben genannten wesentlichen Eigenschaf ten durch charakteri- 

stische Eigenschaften wie einen 7S-Sedimentationskoef f izien- 
ten und/oder durch eine Loslichkeit in Salzlosung aus. Als 
weitere charakteristische Eigenschaf t k6nnen 7S-Globuline 
keine Cysteinreste enthalten. 

25 

Funktionelle Aquivalente der 7S-Globuline haben in einer wei- 
teren bevorzugten Aus fOhrungs form eine Homologie von minde- 
stens 60%, bevorzugt mindestens 80%, ganz besonders bevorzugt 
mindestens 90%, am meisten bevorzugt mindestens 95% zu einer 

30 der Proteinsequenzen mit der SEQ ID NO: 94 oder 96 wobei die 

Homologie sich bevorzugt uber eine Lange von mindestens 30 
Aminosauren, bevorzugt mindestens 50 Aminosauren besonders 
bevorzugt iiber 100 Aminosauren, am meisten bevorzugt tiber die 
gesamte Lange der jeweiligen Proteine erstreckt, und weisen 

35 die gleichen wesentlichen Eigenschaften eines Speicherpro- 

teins und - bevorzugt- die charakteristischen Eigenschaften 
eines 7S-Speicherproteins auf. 

Besonders bevorzugte llS/12S-Globuline umfassen bevorzugt 
40 HS-Globuline aus Raps, Soja und Arabidopsis insbesondere 

i) HS-Globuline aus Raps mit der SEQ ID NO: 10, 12, 14, 16 
oder 18, am meisten bevorzugt die durch die Nukleinsauren 
gemaS SEQ ID NO: 9, 11, 13, 15 oder 17 kodierten Pro- 
45 teine, 
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ii) die llS-Globuline aus Soja mit der SEQ ID NO: 20, 22, 24, 
26 oder 28, am meisten bevorzugt die durch die Nuklein- 
sauren gem££ SEQ ID NO: 19., 21, 23, 25 oder 27 kodierten 
Proteine, 

5 

iii) die llS-Globuline aus Arabidopsis thaliana mit der SEQ ID 
NO: 60, 62, 64, 66, 68 oder 70 am meisten bevorzugt die 
durch die Nukleinsauren gemaS SEQ ID NO: 59, 61, 63, 65, 
67 oder 69 kodierten Proteine, 

10 

sowie die entsprechenden Homologen und funktionellen Aquiva- 
lente aus anderen Pf lanzenarten, insbesondere Raps, Sonnen- 
blume, Lein, Sesam, Farberdistel, Olbaum, Soja oder verschie- 
dene Nussarten, wie beispielsweise das Sonnenblume IIS Spei- 

15 cherprotein (SEQ ID NO: 30), insbesondere das durch die Nu- 

kleinsauresequenz gemaS SEQ ID NO: 29 kodierte Protein. Funk- 
tionelle Aquivalente zeichnen sich bevorzugt neben den oben 
genannten wesentlichen Eigenschaf ten durch charakteristische 
Eigenschaften wie einen 11S- oder 12S-Sedimentationskoef f i- 

20 zienten und/oder durch eine Loslichkeit in Salzlosung (PBS; 

phosphatgepufferte Salzlosung) und/oder eine schlechte Los- 
lichkeit in Wasser aus. 

Funktionelle Aquivalente der 11S- oder 12 S Albumine haben in 
25 einer weiteren bevorzugten Aus fuhrungs form eine Homologie von 

mindestens 60%, bevorzugt mindestens 80%, ganz besonders be- 
vorzugt mindestens 90%, am meisten bevorzugt mindestens 95% 
zu einer der Proteinsequenzen mit der SEQ ID NO: 10, 12, 14, 
16, 18, 20, 22, 24, 26, 28, 30, 60, 62, 64, 66, 68 oder 70 
30 wobei die Homologie sich bevorzugt Ober eine Lange von minde- 

stens 30 Aminosauren, bevorzugt mindestens 50 Aminosauren be- 
sonders bevorzugt fiber 100 Aminosauren, am meisten bevorzugt 
ttber die gesamte Lange der jeweiligen Proteine erstreckt, und 
weisen die gleichen wesentlichen Eigenschaften eines Spei- 
35 cherproteins und - bevorzugt- die charakteristischen Eigen- 

schaften eines 11S- oder 12S-Speicherproteins auf . 

Besonders bevorzugte Ze in- Prolamine umfassen bevorzugt solche 
aus monokotyledonen Pflanzen, insbesondere Mais, Rais, Hafer, 

40 Gerste oder Weizen. Ganz besonders bevorzugt sind die Mais 

Zein-Prolamine beschrieben durch SEQ ID NO: 98, 100, 102 oder 
104 - insbesondere die durch SEQ ID NO 97, 99, 101 oder 103 
kodierten Protein -, das Reis Prolamin gemafc SEQ ID NO: 106 - 
insbesondere das durch SEQ ID NO 105 kodierte Protein das 

45 Hafer Prolamin gemafe SEQ ID NO: 108 - insbesondere das durch 

SEQ ID NO 107 kodierte Proteine-, das Gerste Prolamin gemaS 
SEQ ID NO: 110 und/oder 111 - insbesondere das durch SEQ ID 
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NO 109 kodierte Protein - und das das Weizen Prolamin gem&£ 
SEQ ID NO: 113 - insbesondere das durch SEQ ID NO 112 ko- 
dierte Protein. Funktionelle Aquivalente zeichnen sich bevor- 
zugt durch eine Loslichkeit in 70%iger ethanolischer Losung 
5 und eine schlechte Loslichkeit in Wasser oder Salzlosung aus. 

Funktionelle Aquivalente der Zein-Prolamine haben in einer 
weiteren bevorzugten Aus fuhrungs form eine Homologie von min- 
destens 60%, bevorzugt mindestens 80%, ganz besonders bevor- 
10 zugt mindestens 90%, am meisteri bevorzugt mindestens 95% zu 

einer der Proteinsequenzen mit der SEQ ID NO: 98, 100, 102, 
104, 106, 108, 110, 111 oder 113 wobei die Homologie sich be- 
vorzugt liber eine Lange von mindestens 30 AminosSuren, bevor- 
zugt mindestens 50 Aminosauren besonders bevorzugt iiber 100 
. 15 Aminosauren, am meisten bevorzugt tiber die gesamte Lange der 

jeweiligen-Proteine erstreckt, und weisen die' gleichen -we- 
sentlichen Eigenschaf ten eines Speicherproteins und - bevor- 
zugt- die charakteristischen Eigenschaf ten eines Zein-Prola- 
mine auf. 

20 

Funktionelle Aquivalente meint insbesondere naturliche oder 
kttnstliche Mutationen der obengenannten Speicherproteine so- 
wie homologe Polypeptide aus anderen Pflanzen, die die glei- 
chen wesentlichen und - bevorzugt - charakteristischen Eigen- 

25 . schaften aufweisen. Bevorzugt sind homologe Polypeptide aus 

oben beschriebenen bevorzugten Pflanzen. Die zu den im Rahmen 
dieser Erfindung of fenbarten Speicherproteinen homologen Se- 
quenzen aus anderen Pflanzen - beispielsweise solchen deren 
genomische Sequenz ganz oder teilweise bekannt ist, wie bei- 

30 spielsweise aus Arabidopsis thaliana, Brassica napus, Nico- 

tiana tabacum oder Solanum tuberosum - durch Homologiever- 
gleiche aus Datenbanken auffinden. konnen z.B. durch Daten-, 
banksuche oder Durchmustern von Gen-Banken - unter Verwendung 
der beispielhaft aufgefiihrten Speicherprotein-Sequenzen als 

35 Suchsequenz bzw. Sonde - leicht aufgefunden werden. 

Mutationen umfassen Subs ti tut ionen, Additionen, Deletionen, 
Inversion oder Insertionen eines oder mehrerer Aminosaurere- 
ste. 

40 

Ein weiterer Gegenstand der Erfindung umfasst ein zumindest 
teilweise doppelstrangiges Ribonukleinsauremolekul , wobei das 
doppelstrangige Ribonukleinsauremolekul umfasst 

45 i) einen 11 sense W -RNA-Strang umfassend mindestens zwei Ribo- 

nukleotidsequenzabschnitte, wobei jeweils mindestens ei- 
ner dieser Ribonukleotidsequenzabschnitte im wesentlichen 
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identisch ist zu mindestens einem Teil des »sense"-RNA- 
Transkriptes einer Speicherprotein-Nukleinsauresequenz 
gemafc SEQ ID NO: 1, 3, 5, 7, 9, 11, 13, 15 , 17, 19, 21, 
23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 
5 51, 59, 61, 63, 65, 67, 69, 71, 93, 95, 97, 99, 101, 103, 

105, 107, 109 oder 112 oder eines funktionellen Aquiva- 
lentes derselben, wobei jedoch nicht alle Ribonukleotid- 
sequenzabschnitte zu dem "sense'-RNA-Transkript eines 
einzigen einer Speicherprotein-N\xkleinsaureseguenz iden- 
10 tisch sind, und 

ii) einen »antisense"-RNA-Strang, der zu dem RNA-sense-Strang 
unter i) im wesentlichen komplementaren ist. 

15 Bevorzugt haben zumindest zwei der Speicherprotein-Nuklein- 
sauresequenzen, zu deren w sense « -RNA-Transkript die besagten 
Ribonukleotidsequenzabschnitte im wesentlichen identisch " 
sind, untereinander eine Homologie von unter 90%, bevorzugt 
unter 80%, ganz besonders bevorzugt unter 60% am meisten be- 

20 vorzugt unter 50% uber die gesamte Lange ihrer kodierenden 
Nukleotidsequenz . 

In einer weiteren bevorzugten Ausfuhrungsf orm enthalt die 
dsRNA mehrere Sequenzabschnitte, die eine gleichzeitige Sup- 
25 pression mehrerer Speicherproteine, bevorzugt von Speicher- 

proteinen aus verschiedenen Klassen - wie beispielsweise ei- 
nem 2S-Albumin, 7S-Globuline, HS/12S-Globulin oder die Zein- 
Prolamine - bewirken. 

30 Am meisten bevorzugt sind doppelstrangige RNA Molekiile be- 

schrieben durch die Ribonukleinsauresequenz gemaS SEQ ID NO: 
84, 86 oder 88. Diese werden bevorzugt kodiert durch Nukleo- 
tidsequenzen entsprechend SEQ ID NO: 83, 85 oder 87. 

35 5. Erreichen einer Resistenz gegen pflanzliche Pathogene 

' Eine Resistenz gegen pflanzliche Pathogene wie Arachniden, 
Pilze, Insekten, Nematoden, Protozoen, Viren, Bakterien und 
Krankheiten kann erreicht werden durch Verminderung der Ge- 

40 nexpression von Genen, die filr das Wachstum, Oberleben, be- 
stimmte Entwicklungsstuf en (beispielsweise Verpuppung) oder 
die Vermehrung eine bestimmten Pathogens essentiell sind. 
Eine entsprechende Verminderung kann eine vollstandige Inhi- 
bition vorgenannter Schritte aber auch eine VerzSgerung der- 

45 selben bewirken. Dies konnen pflanzliche Gene sein, die dem 

Pathogen beispielsweise das Eindringen ermoglichen, kbnnen 
aber auch pathogen-eigene Gene sein. Bevorzugt ist die dsRNA 



WO 03/078629 



• 




PCT/EP03/02735 



35 



10 
15 
20 
25 
30 

6. 

35 
40 

7. 



gg. Gene des Pathogens gerichtet. Als anti-Pathogenes Agens 
kann dabei die dsRNA selber, jedoch auch die Expressionssy- 
steme, Expressionskassetten oder transgenen Organismen wir- 
ken. Pflanzen k6nnen beispielsweise mit. geeigneten Formulie- 
rungen vorgenannter Agentien behandelt, beispielsweise be- 
sprtiht oder est&ubt werden Die Pflanzen selber konnen jedoch 
in Form eines transgenen Organismus die Agentien beinhalten 
und diese - beispielsweise in Form eines Fra&giftes - an die 
Pathogene weitergeben. Verschiedene essentielle Gene diverser 
Pathogene sind dem Fachmann bekannt (z.B. fur Nematodenresi- 
stenz WO 93/10251, WO 94/17194). 

Am meisten bevorzugt als Pathogen sind Pilzpathogene wie Phy- 
tophthora infestans, Fusarium nivale, Fusarium graminearum, 
Fusarium culmorum, Fusarium oxysporum, Blumeria graminis, 
Magnaporthe grisea, Sclerotinia sclerotium, Septoria nodorum, 
Septoria tritici, Alternaria brassicae, Phoma lingam, bakte- 
rielle Pathogene wie Corynebacterium sepedonicum, Erwinia ca- 
rotovora, Erwinia amylovora, Streptomyces scabies, Pseudomo- 
nas syringae pv. tabaci, Pseudomonas syringae pv. phaseoli- 
cola, Pseudomonas syringae pv. tomato, Xanthomonas campestris 
pv. malvacearum und Xanthomonas campestris pv. oryzae, und 
Nematoden wie Globodera rostochiensis , G. pallida, Hetero- 
dera schachtii, Heterodera av^nae, Ditylenchus dipsaci, An- 
guina tritici und Meloidogyne hapla. 

Eine Virusresistenz kann beispielsweise durch Verminderung 
der Expression eines viralen Hullproteins, einer viralen Re- 
plikase, einer viralen Protease etc. erreicht werden. Zahl- 
reiche Pf lanzenviren und entsprechende Zielgene sind dem 
Fachmann bekannt. 

Verhinderung von Halmbruch 

Eine verminderte Anfalligkeit gegen Halmbruch kann beispiels- 
weise erreicht werden durch Verminderung der Genexpression 
von Genen des Kohlenhydratstof fwechsels (s.o.). Vorteilhafte 
Gene sind beschrieben (u.a. WO 97/13865) und umfassen geweb- 
spezifische Polygalacturonasen oder Cellulasen. 

Verzogerung der Fruchtreifung 

Eine verz6gerte Fruchtreifung kann beispielsweise erreicht 
werden durch Verminderung der Genexpression von Genen ausge- 
wahlt aus der Gruppe bestehend aus Polygalacturonasen, Pecti- 
nesterasen, p- (1-4) glucanasen (Cellulasen) , P-Galactanasen ( 
P-Galactosidasen) , oder Gene der Ethylenbiosynthese wie 
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1-Aminocyclopropan-l-carboxylatsynthase, Gene der Carotinoid- 
biosynthese wie z.B. Gene derPrephytoen- oder Phytoenbiosynt- 
hese beispielsweise Phytoendesaturasen. Weitere vorteilhafte 
Gene sind bespielsweise in WO 91/16440, WO 91/05865, WO 
5 91/16426, WO 92/17596, WO 93/07275 oder WO 92/04456. 

8. Erzielen einer mannlichen Sterilitat ("male sterility"). Ent- 
sprechende Zielgene sind beschrieben u.a. in WO 94/29465, 
WO89/10396, WO 92/18625. 

10 

9. Verminderung unerwunschter oder toxischer Pf lanzeninhalts- 
stoffe wie z.B. Glucosinolaten. Entsprechende Zielgene sind 
beschrieben (u.a. in WO 97/16559). 

15 10. Verz6gerung von Alterserscheinungen. Entsprechende Zielgene 
sind u.a. Cirmamoyl-CoArNADPH-Reduktasen oder Cinnamoylalko- 
holdehydrogenasen. Weitere Zielgene sind beschrieben (u.a. in 
WO 95/07993) . - 

20 11. Modification der Lignif ikation und/oder des Ligningehaltes 

vor allem in Baumarten. Entsprechende Zielgene sind beschrie- 
ben u.a. in WO 93/05159, WO 93/05160. 

12. Modif ikation des Faseranteils in Nahrungsmitteln vorzugsweise 
25 in Samen durch Verminderung der Expression der Cof f einsaure- 

0-methyl transferase oder der Cinnamoylalkoholdehydrogenase. 

13. Modif aktion der Faserqualit&t in Baumwolle. Entsprechende 
Zielgene sind beschrieben u.a. in US 5,597,718. 

30 

14. Verminderung der Sto&anfailigkeit von beispielsweise Kartof- 
f eln durch Verminderung beispielsweise der. Polyphenolo'xidase 
(WO 94/03607) etc. 

35 15. Steigerung der Vitamin E Biosynthese beispielsweise durch 

Verminderung der Expression von Genen aus dem Homogentisatab- 
bauweg wie z.B. der Homogentisat-1, 2-dioxygenase (HGD; 
EC-Nr . : 1 . 13 . 11 . 5 ) , der Maleylacetoacetatisomerase (MAAI ; 
EC-Nr . : 5.2.1.2.) oder der Fumarylacetoacetathydrolase ( FAAH ; 

40 EC-Nr.: 3.7.1.2). 

Ein weiterer Gegenstand der Erfindung umfasst ein zumindest 
teilweise doppelstrangiges Ribonukleinsauremolekul, wobei das 
doppelstrangige Ribonukleinsauremolektil umfasst 

45 
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i) einen n sense "-RNA-Strang umfassend mindestens zwei Ribo- 
nukleotidsequenzabschnitte, wobei jeweils mindestens ei- 
ner dieser Ribonukleotidsequenzabschnitte im wesentlichen 
identisch ist zu mindestens einem Teil des * sense" -RNA- 

5 Transkriptes eines Gens aus dem Homogentisatabbauweg ge- 

ma£ SEQ ID NO: 115, 116, 118 oder 120 oder eines funktio- 
nellen Aquivalentes derselben, wobei jedoch nicht alle 
Ribonukleotidsequenzabschnitte zu dem * sense "-RNA-Trans- 
kript eines einzigen einer Speicherprotein-Nukleinsaure- 
10 sequenz identisch sind, und 

ii) einen "antisense" -RNA-Strang, der zu dem RNA-sense-Strang 
unter i) im wesentlichen komplementaren ist. 

15 16. Verminderung des Nikotingehaltes beispielsweise in Tabak 

durch verminderte Expression beispielsweise der. N-Methyl-pu- 
trescinoxidase und der Putrescin-N-methyl transferase. 

17. Verminderung des Cof f eingehaltes in der Kaffeebohne (Coffea 
20 arabica) durch durch Verminderung der Genexpression von Genen 

der Coffeinbiosynthese wie 7~Methylxanthine-3-methyltransf e- 
rase. 

18. Verminderung des Theophyllin-Gehaltes im Tee (Camellia sinen- 
25 sis) durch durch Verminderung der Genexpression von Genen der 

Theophyllin-Biosynthese wie beispielsweise 1-Methylxant- 
hin-3-methyltransf erase . 

19. Erhohung des Methioningehaltes durch Verminderung der Threo- 
30 ninbiosynthese, beispielsweise durch Verminderung derExpres- 

sion der Threoninsynthase (Zeh Met al . (2001) Plant Physiol 
127(3) :792-802) . 



Weitere Beispiele fiir vorteilhafte Gene sind zum Beispiel genannt 
35 bei Dunwell JM, Transgenic approaches to crop improvement, J Exp 
Bot. 2000; 51 Spec No; Seite 487-96. 



Jede der oben genannten Anwendungen kann als solche isoliert an- 
gewendet werden. Naturlich kfinnen auch mehr als eine der oben ge- 
nannten Ansatze gleichzeitig angewendet werden. Dabei wird bei 
alien Anwendungen die Expression von mindestens zwei unterschied- 
lichen Zielgenen, wie oben definiert, vermindert. Diese Zielgene 
k6nnen dabei .aus einer einzigen fiir eine Anwendung bevorzugten 
Gruppe von Genen stammen oder aber auch unterschiedlichen Anwen- . 
dungsgruppen zugeordnet sein. 
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Zur Anwendung der erf indungsgemafcen Verf ahren stehen dem Fachmann 
geiaufige Werkzeuge, wie Expressionsvektoren mit fur Pflanzen ge- 
eigneten Promotoren, sowie Verf ahren zur Transformation und Rege- 
neration von Pflanzen zur Verfttgung. Pflanzenspezif ische 
Promotoren meint grundsatzlich jeden Promotor, der die Expression 
von Genen, insbesondere Fremdgenen, in Pflanzen oder Pflanzentei- 
len, -zellen, -geweben, -kulturen steuern kann. Dabei kann die 
Expression beispielsweise konstitutiv, induzierbar oder entwick- 
lungsabhangig sein. Bevorzugt sind: 

a) Konstitutive Promotoren 



"Konstitutive" Promotoren meint solche Promotoren, die eine Ex- 
pression in zahlreichen, . bevorzugt alien, Geweben uber einen 

15 grofieren Zeitraum der Pf lanzenentwicklung, bevorzugt zu alien 
Zeitpunkten der pf lanzenentwicklung, gewahrleisten (Benfey et 
al.(1989) EMBO J 8:2195-2202). Vorzugsweise verwendet man ins- 
besondere einen pflanzlichen Promotor oder einen Promotor, der 
einem Pf lanzenvirus entstammt. Insbesondere bevorzugt ist der 

20 Promotor des 35S-Transkriptes des CaMV Blumenkohlmosaikvirus 

(Franck et al. (1980) Cell 21:285-294; Odell et al. (1985) Na- 
ture 313:810-812; Shewmaker et al. (1985) Virology 140:281-288; 
Gardner et al. (1986) Plant Mol Biol 6:221- 228) oder der 19S 
CaMV Promotor (US 5,352,605; WO 84/02913; Benfey et al. (1989) 

25 EMBO J 8:2195-2202). Ein weiterer geeigneter konstitutiver Pro- 
motor ist der "Rubisco small subunit (SSU) "-Promotor (US 
4,962,028), der LeguminB-Promotor (GenBank Acc.-Nr. X03677) , 
der Promotor der Nopal insynthase aus Agrobacterium, der TR-Dop- 
pelpromotor, der OCS (Octopin Synthase) Promotor aus Agrobacte- 

30 rium, der Ubiquitin Promotor (Holtorf S et al. (1995) Plant Mol 
Biol 29:637-649), den Ubiquitin 1 Promotor (Christensen et al. 
(1992) Plant Mol Biol 18:675-689; Bruce et al. (1989) Proc Natl 
Acad Sci USA 86:9692-9696), den Smas Promotor, den Cinnamylal- 
koholdehydrogenase-Promotor (US 5,683,439), die Promotoren der 

35 vakuolarer ATPase Untereihheiten oder der Promotor eines pro- 
linreichen Proteins aus Weizen (WO 91/13991), sowie weitere 
Promotoren von Genen, deren konstitutive Expression in Pflanzen 
dem Fachmann bekannt ist. 

40 b) Gewebespezif ische Promotoren 

Bevorzugt sind ferner Promotoren mit Spezif itaten fur die Ant- 
heren, Ovarien, Bliiten, Blatter, Stengel, Wurzeln und Samen. 

45 Samenspezif ische Promotoren wie zum Beispiel der Promotor des 
Phaseolins (US 5,504,200; Bustos MM et al. (1989) Plant Cell 
1(9) :839-53) , des 2S Albumingens (Joseffson LG et al. (1987) J 
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Biol Chem 262 : 12196-12201) , des Legumins (Shirsat A et al. 
(1989) Mol Gen Genet 215(2): 326-331), des USP (unknown seed 
protein; Baumlein H et al. (1991) Mol Gen Genet 225(3) :459-67) , 
des Napin Gens (US 5,608,152; Stalberg K et al . (1996) L Planta 
5 199:515-519)/ des Sac char osebindeproteins (WO 00/26388) oder 

der Legumin B4-Promotor (LeB4; B&umlein H et al. (1991) Mol Gen 
Genet 225: 121-128; Baeumlein et al. (1992) Plant Journal 
2(2):233-9; Fiedler U et al. (1995)' Biotechnology (NY) 
13 (10) : 1090f ) , der Oleosin-Promoter aus Arabidopsis (WO 

10 98/45461) , der Bce4-Promoter aus Brassica (WO 91/13980) . Wei- 
tere geeignete samenspezif ische Promotoren sind die der Gene 
kodierend fur das "High Molecular Weight Glutenin" (HMWG) , 
Gliadin, Verzweigungsenzym, ADP Glucose Pyrophosphatase ( AG- 
Pas e) oder die Starkesynthase . Bevorzugt sind ferner Promoto- 

15 ren, die eine samenspezif ische Expression in Monokotyledoneri 

wie Mais, Gerste, Weizen,- Roggen, Reis etc. erlauben. Vorteil- 
haft eingesetzt werden konnen der Promoter des lpt2 oder 
lptl-Gen (WO 95/15389, WO 95/23230) oder die Promotoren be- 
schrieben in WO 99/16890 (Promotoren des Hordein-Gens , des Glu- 

20 telin-Gens, des Oryzin-Gens, des Prolamin-Gens , des Gliadin- 
Gens, des Glutelin-Gens, des Zein-Gens, des Kasirin-Gens oder 
des Secalin-Gens ) . Weitere samenspezif ische Promotoren sind be- 
schrieben in WO89/03887. 

25 Knollen-, Speicherwurzel- oder Wurzel-spezif ische Promotoren 
wie beispielsweise der Patatin Promotor Klasse I (B33), der 
Promotor des Cathepsin D Inhibitors aus Kartoffel. 

Blattspezif ische Promotoren wie Promotor der cytosolischen 
30 FBPase aus Kartoffel (WO 97/05900), der SSU Promotor (small 

subunit) der Rubisco (Ribulose-1, 5-bisphosphatcarboxylase) oder 
der ST-LSI Promotor aus Kartoffel (Stockhaus- et* al. (1989) EMBO 
J 8:2445-2451) . 

35 Blutenspezifische Promotoren wie beispielsweise der Phytoen 

Synthase Promotor (WO 92/16635) oder der Promotor des P-rr Gens 
(WO 98/22593) . 

- Antheren-spezif ische Promotoren wie den 5126-Promotor (US 
40 5,689,049, US 5,689,051), den glob-1 Promotor und den 7-Zein 
Promotor . 

c)Chemisch induzierbare Promotoren 

45 Die Expressionskassetten konnen auch einen chemisch induzierba- 
ren Promotor enthalten (tibersichtsartikel : Gatz et al. (1997) 
Annu Rev Plant Physiol Plant Mol Biol 48:89-108), durch den die 
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Expression des exogenen Gens in der Pflanze zu einem bestimmten 
Zeitpunkt gesteuert werden kann. Derartige Promotoren, wie z.B. 
der PRP1 Promotor (Ward et al. (1993) Plant Mol Biol 
22:361-366), durch Salicylsaure induzierbarer Promotor (WO 
5 95/19443), ein durch Benzolsulf onamid- induzierbarer Promotor 
(EP 0 388 186), ein durch Tetrazyklin- induzierbarer Promotor 
(Gatz et al. (1992) Plant J 2:397-404), ein durch Abscisins&ure 
induzierbarer Promotor (EP 0 335 528) bzw. ein durch Ethanol- 
oder Cyclohexanon- induzierbarer Promotor (WO 93/21334) konnen 
10 ebenfalls verwendet werden. 

d) Stress- oder Pathogen- induzierbare Promotoren 

Ferner sind Promotoren bevorzugt,- die durch biotischen oder ab- 
15 iotischen Stress induziert werden wie beispielsweise der patho- 
gen- induzierbare Promotor des PRPl-Gens (Ward et al. (1993) 
Plant Mol Biol -22:361-366), der hitzeinduzierbare hsp70- oder 
hsp80-Promoter aus Tomate (US 5,187,267), der kalteinduzierare 
alpha-Amylase Promoter aus der Kartoffel (WO 96/12814) , der 
20 licht-induzierbare PPDK Promotor oder der verwundungsinduzierte 
pinll-Promoter (EP375091) . 

Pathogen- induzierbare Promotoren umfassen die von Genen, die 
infolge eines Pathogenbef alls induziert werden wie beispiels- 

25 weise Gene von PR-Proteinen, SAR-Proteinen, p-1, 3-Glucanase, 
Chitinase usw. (beispielsweise Redolfi et al. (1983) Neth J 
Plant Pathol 89:245-254; Uknes, et al. (1992) The Plant Cell 
4:645-656; Van Loon (1985) Plant Mol Viral 4:111-116; Marineau 
et al. (1987) Plant Mol Biol 9:335-342; Matton et al. (1987) 

30 Molecular Plant-Microbe Interactions 2:325-342; Somssich et al. 
(1986) Proc Natl Acad Sci USA 83:2427-2430; Somssich et al. 
(1988) Mol Gen Genetics 2:93-98; Chen et al. (1996) Plant J 
10:955-966; Zhang and Sing (1994) Proc Natl 'Acad Sci USA 
91:2507-2511; Warner, et al. (1993) Plant J 3:191-201; Siebertz 

35 et al. (1989) Plant Cell 1:961-968(1989). 

Umfasst sind auch verwundungs-induzierbare Promotoren wie der 
des pinll Gens (Ryan (1990) Ann Rev Phytopath 28:425-449; Duan 
et al. (1996) Nat Biotech 14:494-498), des wunl und wun2-Gens 

40 (US 5,428,148), des winl- und win2-Gens (Stanford et al. (1989) 
Mol Gen Genet 215:200-208), des Systemin (McGurl et al. (1992) 
Science 225:1570-1573), des WIPl-Gens (Rohmeier et al. (1993) 
Plant Mol Biol 22:783-792; Eckelkamp et al. (1993) FEBS Letters 
323:73-76), des MPI-Gens (Corderok et al. (1994) The Plant J 

45 6(2) :141-150) und dergleichen. 
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e) Entwicklungsabhangige Promotoren 

Weitere geeignete Promotoren sind beispielsweise fruchtreifung- 
spezifische Promotoren, wie .beispielsweise der f ruchtreifung- 
spezifische Promotor aus Tomate (WO 94/21794, EP 409 625) . Ent- 
5 wicklungsabhSngige Promotoren schliefct zum Teil die Gewebespe- 
zifischen Promotoren ein, da die Ausbildung einzelner Gewebe 
naturgemafe entwicklungsabhSngig erfolgt. 

Besonders bevorzugt sind konstitutive sowie samenspezif ische Pro- 
10 raotoren. 

Genetische Kontrollsequenzen umfassen auch weitere Promotoren, 
Promotorelemente oder Minimalpromotoren, die die expressions teu- 
ernden Eigenschaf ten modifizieren konnen. So kann durch geneti- 

15 sche Kontrollsequenzen zum Beispiel die gewebespezifische Expres- 
sion zusatzlich abhangig von bestimmten Stressfaktoren erfolgesn. 
Entsprechende Elemente -sind zum Beispiel. fur Wasserstress, Absci- 
sins&ure (Lam E und Chua NH, J Biol Chem 1991; 266(26): 17131 
-17135) und Hitzestress (Schoffl F et al . , Molecular & General 

20 Genetics 217 (2-3) : 246-53 , 1989) beschrieben. 

Genetische Kontrollsequenzen umfassen ferner auch die 5'-untrans- 
latierte Regionen, Introns oder nichtkodierende 3 '-Region von Ge- 
nen wie beipielsweise das Actin-1 Intron, oder die Adhl-S Introns 

25 1, 2 und 6 (allgemein: The Maize Handbook, Chapter 116, Freeling 
and Walbot, Eds., Springer, New York (1994)). Es ist gezeigt wor- 
den, dass diese eine signifikante Funktionen bei der Regulation 
der Genexpression spielen k6nnen. So wurde gezeigt, dass 5'-un- 
translatierte Sequenzen die transiente Expression heterologer 

30 Gene verst&rken k6nnen. Beispielhaft f\ir Translationsverstarker 
sei die 5 9 -Leaders equenz aus dem Tabak-Mosaik-Virus zu nennen 
(Gallie et al. (1987) Nucl Acids Res 15:8693-8711) und derglei- 
chen. Sie konnen ferner die Gewebsspezif itat fordern (Rouster J 
et al. (1998) Plant- J 15:435-440). 

.35 

Als Kontrollsequenzen geeignete Polyadenylierungssignale sind 
pflanzliche Polyadenylierungssignale, vorzugsweise solche, die im 
wesentlichen T-DNA Polyadenylierungssignale aus Agrobacterium tu- 
mefacienSf insbesondere des Gens 3 der T-DNA (Octopin Synthase) 
40 des Ti-Plasmids pTiACHS entsprechen (Gielen et al. (1984) EMBO J 
3:835 ff) oder funktionelle Aquivalente davon. Beispiele ftir be- 
sonders geeignete Terminatorsequenzen sind der OCS (Octopin-Syn- 
thase) -Terminator und der NOS (Nopalin-Synthase) -Terminator . 

45 Eine Expressionskassetten und die von ihr abgeleiteten Vektoren 
k6nnen weitere Funktionselemente enthalten. Der Begriff Funkti- 
onselement ist breit zu verstehen und meint all solche Elemente, 
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die einen Einfluss auf Herstellung, Vermehrung oder Funktion der 
erfindungsgemassen Expressionskassetten, Vektoren oder transgenen 
Organismen haben. Beispielhaft aber nicht einschrankend seien zu 

■ nennen : 

5 

a) Selektionsmarker, die eine Resistenz gegen einen Metabolis- 
musinhibitor wie 2-Desoxyglucose-6-phosphat (WO 98/45456), 
Antibiotika oder Biozide, bevorzugt Herbizide, wie zum Bei- 
spiel Kanamycin, G 418, Bleomycin, Hygromycin, oder Phosphi- 

10 notricin etc. verleihen. Besonders bevorzugte Selektionsmar- 

ker sind solche die eine Resistenz gegen Herbizide verleihen. 
Beispielhaft seien genannt: UNA Sequenzen, die fur Phosphi- 
nothricinacetyltransferasen (PAT) kodieren und Glutaminsynt- 
haseinhibitoren inaktivieren (bar und pat Gen) , 5-Enolpyru- 

15 vylshikimat-3-phosphatsynthasegene (EPSP Synthasegene ) , die 

eine Resistenz gegen * Glyphosat®. (N- (phosphonomethyl) glycin) 
verleihen, das fur das Glyphosat® degradierende Enzyme kodie- 
rende gox Gen (Glyphosatoxidoreduktase) , das deh Gen (kodie- 
rend fur eine Dehalogenase, die Dalapon inaktiviert ) ; Sulfo- 

20 nylurea- und Iiaidazolinon inaktivierende Acetolactatsynthasen 

sowie bxn Gene, die fur Bromoxynil degradierende Nitrilaseen- 
zyme kodieren, das aasa-Gen, das eine Resistenz gegen das An- 
tibiotikum Apectinomycin verleih, das Streptomycinphospho- 
tr an sferase (SPT) Gen, das eine Resistenz gegen Streptomycin 

25 gewahrt, das Neomycinphosphotransf eras (NPTII) Gen, das eine 

Resistenz gegen Kanamycin oder Geneticidin verleiht, das Hy- 
gromycinphosphotransferase (HPT) Gen, das eine Resistenz ge- 
gen Hygromycin vermittelt, das Acetolactatsynthas Gen (ALS) , 
das eine Resistenz gegen Sulfonylharnstoff -Herbizide verleiht 

30 (z.B. mutierte ALS-Varianten mit z.B. der S4 und/oder Hra Mu- 

tation) . 

b) Reportergene, die fur leicht quantif izierbare Proteine kodie- 
ren und liber Eigenfarbe oder Enzymaktivitat eine Bewertung 

35 der Trans f ormationsef f izienz oder des Expressionsortes oder 

-zeitpunktes gewahrleisten. Ganz besonders bevorzugt sind da- 
bei Reporter-Proteine (Schenborn E, Groskreutz D. Mol Bio- 
technol. 1999; 13(l):29-44) wie das "green fluorescence pro- 
tein" (GFP) (Sheen et al. (1995) Plant Journal 8 (5) : 777-784) , 

40 die Chloramphenicoltransf erase, eine Luzif erase (Ow et al. 

(1986) Science 234:856-859), das Aequorin-Gen (Prasher et al. 
(1985) Biochem Biophys Res Commun 126 (3 ): 1259-1268 ) ; die 
P-Galactosidase, ganz besonders bevorzugt ist die p-Glucuro- 
nidase (Jefferson et al. (1987) EMBO J 6:3901-3907). 



45 
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c) Replikationsursprunge, die eine Vermehrung der erf indungsge- 
m&ssen Expressionskassetten oder Vektoren in zum Beispiel 
E.coli gewahrleisten. Beispielhaft seien genannt ORI (origin 
of DNA replication) , der pBR322 ori oder der P15A ori (Sam- 

5 brook et al . : Molecular Cloning. A Laboratory Manual, 2nd ed. 

Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 
1989) . 

d) Elemente, die ftlr eine Agrobakterium vermittelte Pflanzen- 

10 transformation erforderlich sind, wie zum Beispiel die rechte 

oder linke Begrenzung der T-DNA oder die vir-Region. 

Zur Selektion erfolgreich homolog rekombinierter oder auch trans - 
formierter Zellen ist es in der Regel erforderlich, einen selek- 

15 tionierbaren Marker zusStzlich einzufiihren, der den erfolgreich 
rekombinierten Zellen eine Resistenz gegen ein Biozid (zum Bei- 
spiel ein Herbizid) , .einen Metabolismusinhibitor wie 2-Desoxyglu- 
cose-6-phosphat (WO 98/45456) oder ein Antibiotikum verleiht. Der 
Selektionsmarker erlaubt die Selektion der trans formier ten Zellen 

20 von untransformierten (McCormick et al. (1986) Plant Cell Reports 
5:81-84) . 

Verschiedene Methoden und Vektoren zum Einschleusen von Genen in 
das Genom von Pflanzen sowie zur Regeneration von Pflanzen aus 

25 Pflanzengeweben oder Pf lanz^nzellen sind bekannt (Plant Molecular 
Biology and Biotechnology (CRC Press, Boca Raton, Florida), Kapi- 
tel 6/7, S. 71-119 (1993); White FF (1993) Vectors for Gene 
Transfer in Higher Plants; in: Transgenic Plants, Bd. 1, Enginee- 
ring and Utilization, Hrsgb. : Kung und Wu R, Academic Press, 

30 15-38; Jenes B et al. (1993) Techniques for Gene Transfer, in: 
Transgenic Plants, .Bd. 1, Engineering and Utilization, Hrsgb.: 
Kung und R. Wu, Academic Press, S. 128-143; Potrykus (1991) Annu 
Rev Plant Physiol Plant Molec Biol 42:205-225; Halford NG, Shewry 
PR (2000) Br Med Bull 56 (1) : 62-73) . Dazu zahlen beispielhaft die 

35 oben erwahnten . Bei Pflanzen werden dabei die beschriebenen Me- 
thoden zur Transformation und Regeneration von Pflanzen aus 
Pflanzengeweben oder Pf lanzenzellen zur transienten oder stabilen 
Transformation genutzt. Geeignete Methoden sind vor allem die 
Protoplastentransformation durch Polyethylenglykol-induzierte 

40 DNA-Auf nahme , die Liposomen vermittelte Transformation (wie z.B. 
in US 4,536,475 beschrieben) , biolistische Verfahren mit der Gen- 
kanone ("particle bombardment" Methode; Fromm ME et al . (1990) 
Bio/Technology. 8(9):833-9; Gordon-Kamm et al. (1990) The Plant 
Cell 2:603), die Elektroporation, die Inkubation trockener Em- 

45 bryonen in DNA-haltiger Losung und die Mikroinjektion. Im Falle 
dieser "direkten" Transf ormationsmethoden sind keine besonderen 
Anf orderungen an das verwendete Plasmid gestellt. Einfache Plas- 
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raide wie die der pUC-Reihe, pBR322, M13mp Reihe, pACYC184 etc. 
konnen verwendet werden. Sollen vollst&ndige Pflanzen aus den 
trans formier ten Zellen regeneriert werden, so ist er erf order - 
lich, das sich auf dem Plasmid ein zusatzliches selektionierbares 
5 Markergen befindet. 

Neben diesen "direkten" Transf ormationstechniken kann eine Trans- 
formation auch durch bakterielle Inf ektion mittels Agrobacterium 
(z.B. EP 0 116 718), virale Infektion mittels viraler Vektoren 
10 (EP 0 067 553; US 4,407,956; WO 95/34668; WO 93/03161) oder 
mittels Pollen (EP 0 270 356; WO 85/01856; US 4,684,611) durchge- 
fiihrt werden. 

Die fur die .Agrombacterium-Transf ormation meist verwendeten 

15 Stamme Agrobacterium tumefaciens oder Agrobacterium rhizogenes 
eine auch durch bakterielle Infektion mittels' enthalten ein Plas- 
mid (Ti bzw. Ri Plasmid) , das auf die Pflanze nach Agrobaterium- 
Infektion ubertragen wird. Ein Teil dieses Plasmids, genannt T- 
DNA (transferred DNA) , wird in das Genom der Pf lanzenzelle inte- 

20 griert. Alternativ konnen durch Agrobakterium auch binare vekto- 
ren (Mini-Ti-Plasmide) auf Pflanzen ubertragen und in deren Genom 
integriert werden. Die Agrobacterium-vermittelte Transformation 
ist am besten ftir dicotyledone, diploide Pf lanzenzellen geeignet, 
wohingegen die direkten Transf ormationstechniken sich fur jeden 

25 Zelltyp eignen. Verfahren zur Agrobakterium vermittelten Trans- 
formation sind beispielsweise beschrieben bei Horsch RB et al. 
(1985) Science. 225 :1229f. Werden Agrobacterien verwendet, so ist 
die Expressionskassette in spezielle Plasmide zu integrieren, 
entweder in einen Zwischenvektor (englisch: shuttle or interme- 

30 diate vector) oder einen binaren Vektor. Wird ein Ti oder Ri 
Plasmid zur Transformation verwendet werden soil, ist zumindest 
die rechte Begrenzung, meistens jedoch die rechte und die linke 
Begrenzung der Ti oder Ri Plasmid T-DNA als f lankierende Region 
mit der einzufiihrenden Expressionskassette verbunden. 

35 

Fur die Agrobacterium Tranf ormation werden bevorzugt binare Vek- 
toren verwendet. Binclre Vektoren konnen sowohl in E.coli als auch 
in Agrobacterium replizieren. Sie enthalten in der Regel ein Se- 
lektionsmarkergen und einen Linker oder Polylinker flankiert von 

40 der rechten und linken T-DNA Begrenzungssequenz . Sie k6nnen di- 
rekt in Agrobacterium transf ormiert werden (Holsters et al. 
(1978) Mol Gen Genet 163:181-187). Das Selektionsmarkergen er- 
laubt eine Selektion transf ormiert er Agrobakteria und ist zum 
Beispiel das nptll Gen, das eine Resist enz gegen Kanamycin ver- 

45 leiht. Das in diesem Fall als Wirtsorganismus fungierende Agro- 
bacterium sollte bereits ein Plasmid mit der vir-Region enthal- 
ten. Diese ist far die Ubertragung der T-DNA auf die pflanzliche 
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Zelle erf order lich. Ein so transf ormiertes Agrobacterium kann zur 
Transformation pflanzlicher Zellen verwendet werden. Die Verwen- 
dung von T-DNA zur Transformation pflanzlicher Zellen ist inten- • 
siv untersucht und beschrieben (EP 120 516; Hoekema, In: The Bi- 
5 nary Plant Vector System, Of f setdrukkeri j Ranters B.V. f Alblas- 
s£rdam, Chapter V; An et al. (1985) EMBO J 4:277-287). Verschie- 
dene binSre Vektoren sind bekannt und teilweise kommerziell er- 
haitlich wie zum Beispiel pBI101.2 oder pBINl9 (Clontech Labora- 
tories, Inc. USA; Bevan et al.(1984) Nucl Acids Res 12:8711), 
10 pBinAR, pPZP200 oder pPTV. 

Die mit einem solchen Vektor trans formier ten Agrobakterien konnen 
dann in bekannter Weise zur Transformation von Pflanzen, ins- 
besondere von Kulturpf lanzen, wie z.B. von Raps, verwendet wer- 

15 den, indem beispielsweise verwundete Blatter oder Blattstucke in 
einer Agrobakterienlosung gebadet und anschliessend in geeigneten 
Medien kultiviert werden. Die Transformation von Pflanzen durch 
Agrobakterien ist beschrieben (White FF, Vectors for Gene 
Transfer in Higher Plants; in Transgenic Plants, Vol. 1, Enginee- 

20 ring and Utilization, herausgegeben von S.D. Kung und R. Wu, 

Academic Press, 1993, S. 15 - 38; Jenes B et al. (1993) Techniques 
for Gene Transfer, in: Transgenic Plants, Vol. 1, Engineering and 
Utilization, herausgegeben von S.D. Kung und R. Wu, Academic 
Press, S. 128-143; Potrykus (1991) Annu Rev Plant Physiol Plant 

25 Molec Biol 42:205- 225). Aus den trans formier ten Zellen der ver- 
wundeten Blatter bzw. Blattstucke konnen in bekannter Weise 
transgene Pflanzen regeneriert werden, die integriert die oben 
beschriebenen erf indungsgem&ssen Expressionssysteme enthalten. 

30 Stabil trans formier te Zellen d.h. solche, die die eingefuhrte DNA 
integriert in die DNA der Wirtszelle enthalten, k6nnen von un- 
transformierten selektioniert werden, wenn ein selektionierbarer 
Marker Bestandteil der eingefuhrten DNA ist. Als Marker kann bei- 
spielhaft jedes Gen fungieren, dass eine Resistenz gegen Antibio- 

35 tika oder Herbizide (wie Kanamycin, G418, Bleomycin, Hygromycin 
oder Phosphinotricin etc.) zu verleihen vermag (s.o.). Transf or- 
mierte Zellen, die ein solches Markergen exprimieren, sind in der 
Lage, in der Gegenwart von Konzentrationen eines entsprechenden 
Antibiotikums oder Herbizides zu uberleben, die einen untransfor- 

40 mierten Wildtyp abt6ten. Beispiel sind oben genannt und umfassen 
bevorzugt das bar Gen, dass Resistenz gegen das Herbizid Phosphi- 
notricin verleiht- (Rathore KS et al. (1993) Plant Mol Biol 
21(5) : 871-884) , das nptll Gen, dass Resistenz gegen Kanamycin 
verleiht, das hpt Gen, das Resistenz gegen Hygromycin verleiht, 

45 oder das EPSP-Gen, das Resistenz gegen das Herbizid Glyphosat 
verleiht. Der Selektionsmarker erlaubt die Selektion von trans- 
formierten Zellen von untrans formier ten (McCormick et al. (1986) 
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Plant Cell Reports 5:81-84). Die erhaltenen Pflanzen konnen in 
iiblicher Weise geztichtet und gekreuzt werden. Zwei oder mehr Ge- 
nerationen sollten vorzugsweise kultiviert werden, um sicherzu- 
stellen, dass die genomische Integration stabil und vererblich 
5 ist. 

Sobald eine transf ormierte Pf lanzenzelle hergestellt wurde, kann 
eine vollstandige Pf lanze unter Verwendung von deio Fachmann be- 
kannten Verfahren erhalten werden. Hierbei geht man beispielhaft 

10 von Kalluskulturen aus..Aus diesen noch undif f erenzierten Zell- 
massen kann die Bildung von Spross und'Wurzel in bekannter Weise 
induziert werden. Die erhaltenen Sprosslinge konnen ausgepflanzt 
und gezuchtet werden. Entsprechende Verfahren sind beschriebe 
(Fennell et al. (1992) Plant Cell Rep. 11: 567-570; Stoeger et al 

15 (1995) Plant Cell Rep. 14:273-278; Jahne et al. (.1994) Theor Appl 
Genet 89:525-533) . 

Die Wirksamkeit der Expression der transgen exprimierten Nuklein- 
s&uren kann beispielsweise in vitro durch Sprossmeristemvenneh- 
20 rung unter Verwendung einer der oben beschriebenen Selektionsme- 
thoden ermittelt werden. Zudem kann eine in Art und HShe veran- 
derte Expression eines Zielgens und die Auswirkung auf den Phan- 
ptyp der Pflanze an Testpflanzen in Gewachshausversuchen getestet 
werden. 

25 

II. Medizinische Anwendungen 

Die erfindungsgemafc bereitgestellten dsRNA, Express ionssy- 
steme oder Organismen eignen sich zur Herstellung von Arznei- 
30 mitteln zur Behandlung von menschlichen \md tierischen Er- 

krankungen. Fiir eine effizient Therapie ist es oft unzurei- 
chend nur ein einzelnes Zielgen zu vermindern. Das erfin- 
dungsgemaEe Verfahren eignet sich insbesondere zur Behandlung 
von 

35 _ Pathogenbefall, wie beispielsweise virale oder bakte- 

rielle Erkrankungen . In diesen Fallen fuhren Ansatze, die 
lediflich gegen ein molekulares Ziel gerichtet sind, oft 
zu der Ausbildung von Resistenzen. Eine Kombinationthera- 
pie, die mehrere Ziele abdeckt, ist jedoch kompliziert zu 

40 koordinieren und v. a. nur sehr aufwendig in klinischen 

Experimenten zu evaluieren. Das erf indungsgemafie Verfah- 
ren erm6glicht hier eine vorteilhafte Alternative. Die 
inhibitorische dsRNA kann dabei in' der dem Fachmann ge- 
laufigen Weise appliziert werden. dsRNA verftigt uber eine 

45 erstaunliche Stabilitat und ef fiziente Wirkung und kann 

beispielsweise durch Verfutterung entsprechender dsRNA 
exprimierenden Bakterien appliziert werden. Das Verfahren 




WO 03/078629 PCT/EP03/02735 



47 

eignet sich insbesondere zur Behandlung von viralen In- 
fektionen z.B. mit dem u human immunodeficiency virus" 
(HIV) , indem gleichzeitig die Expression von mindestens 
zwei viralen Gene vermindert wird, beispielsweise bei HIV- 
5 von Genen wie gp41, die fur den Zelleintritt verantwort- 

lich sind, und der viralen Replikase oder reversen Trans- 
kriptase . 

Behandlung von Krebs (beispielsweise solider Tumore und/ 
10 oder LeukSmien) . Zahlreiche potentialle Zielgene sind 

hier dem Fachmann bekannt (z.B. Oncogene wie ABLl, BCL1, 
BCL2 , BCL6 , CBFA2, CBL, CSFlR, ERBA, ERBB, EBRB2 , FGR, 
FOS, FYN, HRAS, JUN, LCK, LYN, MYB, MYC, NRAS, RET oder 
SRC; Tumor suppressorgene wie BRCA1 oder BRCA2 ; Adhasions- 
!5 molekttle; Cyclinekinasen und deren Inhibitoren) . 

Weitere potentiell mit dem erf indungsgema&en Verfahren behan- 
delbare Erkrankungen und die entsprechenden Zielgene sind dem 
Fachmann ohne weiteres zuganglich und umfassen beuspielsweise 

20 Erkrankungen des Herz/Kreislauf systems wie Bluthochdruck , Er- 

krankungen des zentralen oder peripheren Nervensystems wie ■ 
Alzheimer, Parkinson oder multiple Sklerose usw. Auch ist es 
durch das erf indungsgemafce Verfahren moglich, mehr als eine 
Erkrankung parallel zu behandeln, wie beispielsweise ein 

25 Herzkreilauferkrankung und eine Erkrankung des zentralen Ner- 

vensystems, was durch klassische Ansatze nicht mSglich ist. 
Derartige Ansatze sind v. a. bei multiplen Erkrankungen wie 
sie oft im f ortgeschrittenen Alter auftreten vorteilhaft. 
Beispielhaft sei die parallele Behandlung von Bluthochdruck 

30 und z.B. Alzheimer oder seniler Demenz zu nennen. Dabei kann 

dieser Anwendungen als solche isoliert angewendet werden. Na- 
turlich k6nnen .auch mehr als eine der "oben genannten Ansatze 
gleichzeitig angewendet werden. Dabei wird bei alien Anwen- 
dungen die Expression von mindestens zwei unterschiedlichen 

35 Zielgenen vermindert. Diese Zielgene konnen dabei aus der-fttr 

eine Anwendung bevorzugten Gruppe von Genen stammen oder aber 
auch unterschiedlichen Anwendungsgruppen zugeordnet sein. 



III. Biotechnologische Anwendungen 

40 

Das erfindungsgemafie Verfahren l&St sich vorteilhaft in bio- 
technologischen Verfahren anwenden. Beispielhaft jedoch nicht 
einschrankend sei zu nennen die Optimierung von Stof fwechsel- 
wegen in fermentativ genutzten Hefen, Pilzen oder anderen eu- 
45 karyotischen Mikroorganismenoder Zellen zur Herstellung von 

Feinchemikalien wie Aminosauren (z.B. Lysin oder Methionin) , 
Vitaminen (wie Vitamin B2, Vitamin C, Vitamin E) , Carotinoi- 
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den, Olen und Fetten, polyungesattigten Fettsauren, Biotin 
usw. Dabei kann dieser Anwendungen als solche isoliert ange- 
wendet werden. Natiirlich konnen auch iaehr als eine der oben 
genannten Ansatze gleichzeitig angewendet werden. Dabei wird 
5 bei alien Anwendungen die Expression von mindestens zwei un- 

terschiedlichen Zielgenen vermindert. Diese Zielgene konnen 
dabei aus der fur eine Anwendung bevorzugten Gruppe von Genen 
stammen oder aber auch unterschiedlichen Anwendungsgruppen 
zugeordnet sein. 

10 

Als Vektoren zur Expression in E.coli sind bevorzugt pQE70, pQE60 
und pQE-9 (QIAGEN, Inc.); pBluescript Vektoren, Phagescript Vek- 
toren, pNH8A, pNH16a, pNHl8A, pNH46A (Stratagene Cloning Systems, 
Inc.).; ptrc99a, pKK223-3, pKK233-3, pDR540, pRIT5 (Pharmacia. Bio - 
15 tech, Inc . ) . 

Bevorzugte Vektoren zur eukaryotischen Expression umfassen 
pWLNEO, pSV2CAT, pOG44, pXTl und pSG (Stratagene Inc.); pSVK3 , 
pBPV, pMSG und pSVL (Pharmacia Biotech, Inc.). Als induzierbare 

20 Vektoren seien pTet-tTak, pTet-Splice, pcDNA4/TO, pcDNA4/TO / 
LacZ, pcDNA6/TR, pcDNA4/TO/Myc-His /LacZ, pcDNA4/TO/Myc-His A, 
pcDNA4/TO/Myc-His B, pcDNA4/TO/Myc-His C, pVgRXR (Invitrogen, 
Inc.) oder die pMAM-Serie (Clontech, Inc.; GenBank Accession No.: 
U02443) zunennen. Diese stellen bereits das induzierbare regula- 

25 torisphe Kont roll element beispielsweise fur eine chemisch, indu- 
zierbare Expression eines DSBI-Enzyms zur Verftigung. In diese 
Vektoren kann die Nukleinsauresequenz kodierend fiir ein DSBI-En- 
zym direkt insertiert werden. 

30 Vektoren fur die Expression in Hefe umfassen beispielhaft pYES2, • 
pYDl, pTEFl/Zeo, pY\BS2/GS, pPICZ,pGAPZ, pGAPZalph, pPIC9 , 
PPIC3.5, PHIL-D2 , PHIL-SI, pPIC3SK, pPIC9K, und PA0815 (Invitro- 
gen, Inc . ) . 

35 Vorteilh'af te Kontrollsequenzen sind beispielsweise die gram-posi- 
tiven Promotoren amy und SP02, und die Hefe- oder Pilzpromotoren 
ADC1, MFa , AC, P-60,.CYC1, GAPDH, TEF, rp28, ADH. 

Klonierungsvektoren und Techniken zur genetischen Manipulation 
40 von Ciliaten und Algen sind dem Fachmann bekannt (WO 98/01572; 
Falciatore et al. (1999) Marine Biotechnology 1 (3) :239-251; Duna- 
hay et al . (1995) J Phycol 31:10004-1012). 

Als Selektionsmarker konnen prinipiell viele der auch fur Pflan- 
45 zen bevorzugten Selektionssysteme verwendet werden. Insbesondere 
bevorzugt sind fur Saugerzelle die Neomycin (G418) Resistenz, die 
Hygromycin-Resistenz, die Zeocin-Resistenz oder die Puromycin-Re- 
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sistenz. Fur Prokaryoten ist insbesondere die Ampicillin-Resi- 
stenz, die Kanamycin-Resistenz oder die Tetracyclin-resistent be- 
vorzugt . 

5 Prinzipiell sind fur die Transformation tierischer Zelle oder von 
Hefezellen ahnliche Verfahren wie fur die *direkte" Tranf ormation 
von pflanzlichen Zellen anzuwenden. Insbesondere Verfahren wie 
die Calciumphosphat oder Liposomen vermittelte Transformation 
oder aber Elektroporation sind bevorzugt. 



Ein weiterer Gegenstand der Erfindung betrif ft die Verwendung der 
erf indungsgemassen, transgenen Organismen und der von ihnen abge- 
leitete Zellen, Zellkulturen, Teile - wie zum Beispiel bei trans- 
genen pflanzlichen Organismen Wurzeln, Blatter etc.- , und trans - 

15 genes Vermehrungsgut wie Saaten oder Friichte, zur Herstellung von 
Nahrungs- oder Futtermitteln, Pharmazeutika oder Feinchemikalien, 
wie beispielsweise Enzymen, Vitaminen, Aminosauren , Zucker, Fett- 
sauren, natiirliche und synthetische Geschmacks-, Aroma- und Farb- 
stoffe. Besonders bevorzugt ist die Produktion von Triaclyglyce- 

20 riden, Lipiden, Olen, Fettsauren, Starke, Tocopherolen und Toco- 
trienolen sowie Carotinoiden. Von Menschen und Tieren verzehrbare 
erf indungsgemasse, genetisch veranderte Pflanzen konnen auch bei- 
spielsweise direkt oder nach an sich bekannter Aufbereitung als 
Nahrungsmittel oder Futtermittel verwendet werden. 
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Sequenzen 



1. 

5 

2. 

10 3. 
4. 

15 

5. 

20 

6. 



7. 

25 

8. 

30 

9. 
35 10. 
11. 

40 



SEQ ID NO: 1 

Nukleinsauresequenz kodierend fur A.thaliana Albumin 2S sub- 
unit 1 (GenBank Acc.-No.: M22032) 

SEQ ID NO: 2 

Proteinsequenz kodierend fur A.thaliana Albumin 2S subunit 1 
SEQ ID NO: 3 

Nukleinsauresequenz kodierend fur A.thaliana Albumin 2S sub- 
unit 3 (GenBank Acc.-No.: M22035) 

SEQ ID NO: 4 

Proteinsequenz kodierend fur A.thaliana Albumin 2S subunit 3 
SEQ ID NO: 5 

Nukleins&uresequenz kodierend fur A.thaliana Albumin 2S sub- 
unit 2 (GenBank Acc.-No.: M22034) 

SEQ ID NO: 6 

Proteinsequenz kodierend fur A.thaliana Albumin 2S subunit 2 
SEQ ID NO: 7 

Nukleinsauresequenz kodierend fiir A.thaliana Albumin 2S sub- 
unit 4 (GenBank Acc.-No.: M22033) 

SEQ ID NO: 8 

Proteinsequenz kodierend fur A.thaliana Albumin 2S subunit 4 
SEQ ID NO: 9 

Nukleinsauresequenz kodierend fur B, napus Cruciferin Spei- 
cherprotein (GenBank Acc.-No.: X59294) 

SEQ ID NO: 10 

Proteinsequenz kodierend fur B.napus Cruciferin Speicherpro- 
.tein 

SEQ ID NO: 11 

Nukleinsauresequenz kodierend f\ir Brassica napus Cruciferin 
(GenBank Acc.-No. : X14555) 

SEQ ID NO: 12 

Proteinsequenz kodierend fur Brassica napus Cruciferin 



45 
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13. SEQ ID NO: 13 

Nukleinsauresequenz kodierend fiir B.napus BnC2 Cruciferin 
Speicherprotein (GenBank Acc . -No . : X59295) 

5 14. SEQ ID NO: 14 

Proteinsequenz kodierend fur B.napus BnC2 Cruciferin Spei- 
cherprotein 

15. SEQ ID NO: 15 

10 partielle Nukleinsauresequenz kodierend fur B.napus Crucife- 

rin cru4 subunit (GenBank Acc. -No. : X57848) 

16. SEQ ID NO: 16 

partielle Proteinsequenz kodierend fur B.napus Cruciferin 
15 cru4 subunit 

17. SEQ ID NO: 17 

Nukleinsauresequenz kodierend ftir B.napus crul Cruciferin 
subunit (GenBank Acc. -No. : X62120) 

20 

18. SEQ ID NO: 18 

Proteinsequenz kodierend fur B.napus crul Cruciferin subunit 

19. SEQ ID NO: 19 

25 Nukleinsauresequenz kodierend fur Glycinin A-la-B-x subunit 

aus des Sojabohne (GenBank Acc. -No.: M36686) 

20. SEQ ID NO: 20 

Proteinsequenz kodierend fur Glycinin A-la-B-x subunit aus 
30 des Sojabohne 

21. SEQ ID NO: 21 

Nukleinsauresequenz kodierend fttr Sojabohne Glycinin subunit 
G2 (GenBank Acc. -No. : X15122) 

35 

22. SEQ ID NO: 22 

Proteinsequenz kodierend far Sojabohne Glycinin subunit G2 

23. SEQ ID NO: 23 

40 Nukleinsauresequenz kodierend fur Sojabohne A5A4B3 Glycinin 

subunits (GenBank Acc .-No. : X02626) 

24. SEQ ID NO: 24 

Proteinsequenz kodierend filr Sojabohne A5A4B3 Glycinin sub- 
45 units 
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25. SEQ ID NO: 25 

Nukleinsauresequenz kodierend fur Sojabohne (G.max) Glycinin 
Speicherprotein sub-unit A3-B4 (GenBank Acc.-No.: M10962) 

5 26. SEQ ID NO: 26 

Proteinsequenz kodierend far Sojabohne (G.max) Glycinin Spei- 
cherprotein subunit A3-B4 

27. SEQ ID NO: 27 

10 Nukleinsauresequenz kodierend fur Sojabohne Glycinin subunit 

G3 (GenBank Acc.-No. : X15123) 

28. SEQ ID NO: 28 

Proteinsequenz kodierend fur Sojabohne Glycinin subunit &3 

15 

29. SEQ ID NO: 29 

Nukleinsauresequenz kodierend fur Sonnenblume IIS. Speicher- 
protein (G3-D1) (GenBank Acc.-No. : M28832) 

20 30. SEQ ID NO: 30 

Proteinsequenz kodierend fur Sonnenblume 11S Speicherprotein 

(G3-D1) 

31. SEQ ID NO: 31 

25 Nukleinsauresequenz kodierend fur Raps (B.napus) Napin (Gen- 

Bank Acc . -No . : J02586) 

32 . SEQ ID NO: 32 

Proteinsequenz kodierend fur Raps (B.napus) Napin 

30 

33 . SEQ ID NO: 33 

Nukleinsauresequenz kodierend fur Brassica juncea 2S Spei- 
cherprotein (GenBank Acc.-No. : X65040) 

35 34. SEQ ID NO: 34 

Proteinsequenz kodierend fur Brassica juncea 2S Speicherpro- 
tein 

35. SEQ ID NO: 35 

40 Nukleinsauresequenz kodierend fur Brassica oleracea 2S Spei- 

cherprotein (GenBank Acc.-No.: X65038) 

36 . SEQ ID NO: 36 

Proteinsequenz kodierend far Brassica oleracea 2S Speicher- 
45 protein 
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37. SEQ ID NO: 37 

Nukleinsauresequenz kodierend fur Brassica napus cv. Topas 
Napin (GenBank Acc .-No. : U04945) 

5 38. SEQ ID NO: 38 

Proteinseguenz kodierend fur Brassica napus cv. Topas Napin 

39. SEQ ID NO: 39 

partielle Nukleinsauresequenz kodierend fur Sinapis alba sinl 
10 Speicherprotein (GenBank Acc . -No . : X91799) 

40. SEQ ID NO: 40 

partielle Proteinsequenz kodierend fttr Sinapis alba sinl 
Speicherprotein 

15 

41. SEQ ID NO: 41 

Nukleinsauresequenz kodierend fur Sojabohne (Glycine max) na- 
pin-type 2S Albumin 1 (GenBank Acc. -No.: U71194) 

20 42. SEQ ID NO: 42 

Proteinsequenz kodierend fiir Sojabohne (Glycine max) napin- 
type 2S Albumin 1 

43 . SEQ ID NO : 43 
25 Nukleinsauresequenz kodierend fur Sojabohne (Glycine max) 2S 

Albumin (GenBank Acc. -No. : AF005030) 

44. SEQ- ID NO: 44 

Proteinsequenz kodierend fur Sojabohne (Glycine max) 2S Albu- 

30 min 

45. SEQ ID NO: 45 

Nukleinsauresequenz kodierend fiir Brassica nigra 2S Speicher- 
protein (GenBank Acc. -No. : X65039) 

35 

46. SEQ ID NO: 46 

Proteinsequenz kodierend far Brassica nigra 2S Speicherpro- 
tein 

40 47. SEQ ID NO: 47 

Nukleinsauresequenz kodierend fur Sinapis alba sin5 Speicher- 
protein (GenBank Acc. -No. : X91798) 

48. SEQ ID NO: 48 
45 Proteinsequenz kodierend fur Sinapis alba sin5 Speicherpro- 

tein 
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49. SEQ ID NO: 49 

Nukleinsauresequenz kodierend fur Sonnenblume HaG5 2 S Albu- 
min (GenBank Acc.-No.: X06410) 



5 50. SEQ ID NO: 50 

proteinsequenz kodierend fur Sonnenblume HaG5 2 S Albumin 

51. SEQ ID NO: 51 

partielle Nukleinsauresequenz kodierend ftir Sonnenblume (He- 
10 lianthus annuusV 2S Albumin (GenBank Acc.-No.: X76101) 

52. SEQ ID NO: 52 

partielle Proteinsequenz kodierend fur Sonnenblume (Heliant- 
hus annuus) 2S Albumin 

15 

53. SEQ ID NO: 53 

Nukleinsauresequenz kodierend fur dsRNA zur Suppression von 
Arabidopsis thaliana 12S Speicherprotein AtCru3 (Insert von 
Vektor pCR2 . l-AtCRU3 -RNAi ) 

20 

54. SEQ ID NO: 54 

Ribonukleinsauresequenz kodierend fiir dsRNA zur Suppression 
von Arabidopsis thaliana 12S Speicherprotein AtCru3 

25 55. SEQ ID NO: 55 

Nukleinsauresequenz kodierend fur dsRNA zur Suppression von 
Arabidopsis thaliana 12S Speicherprotein AtCral 

56. SEQ ID NO: 56 

30 Ribonukleinsauresequenz kodierend fttr dsRNA zur Suppression 

von Arabidopsis thaliana 12S Speicherprotein AtCral 

57. SEQ ID NO: 57 

Nukleinsauresequenz kodierend fur dsRNA zur Suppression von 
35 Arabidopsis thaliana 2S Speicherprotein At2S2 



58. SEQ ID NO: 58 

Ribonukleinsauresequenz kodierend fur dsRNA zur Suppression 
von Arabidopsis thaliana 2S Speicherprotein At2S2 

40 

59. SEQ ID NO: 59 

Nukleinsauresequenz kodierend fiir Arabidopsis thaliana 12S 
Cruciferin Speicherprotein (ATCRU3 ? GenBank Acc.-No. : U66916) 



45 
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60. SEQ ID NO: 60 

Proteinsequenz kodierend ftir Arabidopsis thaliana 12S Cruci- 
ferin Speicherprotein (ATCRU3) 

5 61. SEQ ID NO: 61 

Nukleinsauresequenz kodierend ftir A. thaliana 12S Speicherpro- 
tein (CRA1; GenBank Acc. -No. : M37247) 

62. EQ ID NO: 62 

10 Proteinsequenz kodierend fur A. thaliana 12 S. Speicherprotein 

(CRA1) 

63. SEQ ID NO: 63 

Nukleinsauresequenz kodierend fur Arabidopsis thaliana 12S 
15 Speicherprotein AT5g4412Q/MLNl_4 (GenBank Acc . -No. : AY070730) 

64. SEQ ID NO: 64 

Proteinsequenz kodierend ftir Arabidopsis thaliana 12S Spei- 
cherprotein AT5g44120/MLNl_4 

20 

65. SEQ ID NO: 65 

Nukleinsauresequenz kodierend ftir Arabidopsis 12S Speicher- 
protein (CRB; GenBank Acc. -No. : X14313; M37248) 

25 66. SEQ ID NO: 66 

Proteinsequenz kodierend ftir Arabidopsis 12S Speicherprotein 
(CRB) 

67. SEQ ID NO: 67 

30 Nukleinsauresequenz kodierend ftir Arabidopsis thaliana puta- 

tives 12S Speicherprotein (aus GenBank Acc. -No.: AC00.3027) 

68. SEQ ID NO: 68 

Proteinsequenz kodierend ftir Arabidopsis thaliana putatives 
35 Speicherprotein (Protein_id= , 'AAD10679 . 1) 

69. SEQ ID NO: 69 

Nukleinsauresequenz kodierend ftir Arabidopsis thaliana Cruci- 
ferin 12S Spwicherprotein (Atlg03890) (GenBank Acc. -No.: 
40 AY065432) 

70. SEQ ID NO: 70 

Proteinsequenz kodierend fur Arabidopsis thaliana Cruciferin 
12S Speicherprotein (Atlg03890) 

45 
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71. SEQ ID NO: 71 

Nukleinsauresequenz kodierend fur Arabidopsis thaliana Prohi- 
bitin 1 (Atphbl) (GenBank Acc.-No.: U66594) 

5 72. SEQ ID NO: 72 

Proteinsequenz kodierend fiir Arabidopsis thaliana Prohibitin 
1 (Atphbl) 

73. SEQ ID NO: 73 Oligonukleotidprimer OPN1 

10 

74. SEQ ID NO: 74 - Oligonukleotidprimer OPN2 

75. SEQ ID NO: 75 Oligonukleotidprimer OPN3 
15 76. SEQ ID NO: 76 Oligonukleotidprimer OPN4 

77. SEQ ID NO: 77 Oligonukleotidprimer OPN5 • 

78. SEQ ID NO: 78 Oligonukleotidprimer OPN6 

20 

79. SEQ ID NO: 79 Oligonukleotidprimer OPN7 

80. SEQ ID NO: 80 Oligonukleotidprimer OPN8 
•25 81. SEQ ID NO: 81 Oligonukleotidprimer OPN9 

82. SEQ ID NO: 82 Oligonukleotidprimer OPN10 

83. SEQ ID NO: 83 

30 Nukleinsauresequenz kodierend ftir sRNAi4-dsRNA zur Suppres- 

sion mehrerer Speicherproteine 

84. SEQ ID NO: 84 

Ribonukleins&uresequenz kodierend fiir sRNAi4 -dsRNA zur Sup- 
35 pression mehrerer Speicherproteine 

85. SEQ ID NO: 85 

Nukleinsauresequenz kodierend ftir sRNAi 8 -dsRNA zur Suppres- 
sion mehrerer Speicherproteine 

40 

86. SEQ ID NO: 86 

Ribonukleinsauresequenz kodierend fur sRNAi 8 -dsRNA zur Sup- 
pression mehrerer Speicherproteine 

45 87. SEQ ID NO: 87 Oligonukleotidprimer OPN11 
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88. SEQ ID NO: 88 Oligonukleotidprimer OP12 

89. SEQ ID NO: 89 Oligonukleotidprimer OPN13 
5 90. SEQ ID NO: 90 Oligonukleotidprimer OPN15 

91. SEQ ID NO: 91 Oligonukleotidprimer OPN16 

92. SEQ ID NO: 92 Oligonukleotidprimer OPN17 

10 

93. SEQ ID NO: 93 

Nukleinsauresequenz kodierend fiir Arabidopsis thaliana "glo- 
bulin-like protein 1 ' (GenBank Acc.-No.: NM_119834) 

15 94. SEQ ID NO: 94 . 

Proteinsequenz kodierend fiir Arabidopsis thaliana "globulin- 
like .protein" (Protein_id="NP_195388 .1) 



95. SEQ ID NO: 95 

20 Nukleinsauresequenz kodierend fiir Glycine max 7S Samenglobu- 

lin (GenBank Acc.-No. : U59425) 

96. SEQ ID NO: 96 

Proteinsequenz kodierend fiir fiir Glycine max 7S Samenglobulin 

25 

97. SEQ ID NO: 97 

Nukleinsauresequenz kodierend fiir Zea mays 19kD Zein (GenBank 
Acc.-No.: E01144) 

30 98. SEQ ID NO: 98 

Proteinsequenz kodierend fiir Zea mays 19kD Zein 

99 . SEQ ID NO: 99 

Nukleinsauresequenz kodierend fiir Zea mays 19kD alpha Zein Bl 
35 (GenBank Acc.-No.: AF371269) 

100. SEQ ID NO: 100 

Proteinsequenz kodierend fiir Zea mays 19kD alpha Zein Bl 



40 101. SEQ ID NO: 101 

Nukleinsauresequenz kodierend fiir Zea mays 19kD alpha Zein B2 
(GenBank Acc.-No.: AF371270) 



102. SEQ ID NO: 102 
45 Proteinsequenz kodierend fiir Zea mays 19kD alpha Zein B2 
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103. SEQ ID NO: 103 

Nukleinsauresequenz kodierend fur Zea mays 22kD alpha-zein 

(GenBank Aqc.-No.: X61085) 

5 104. SEQ ID NO: 104 

Proteinsequenz kodierend fur Zea mays 22kD alpha-zein 

105. SEQ ID NO: 105 

Nukleinsauresequenz kodierend fur Oryza sativa Prolamin 

10 . (GenBank Acc. -No. : AB016503) 

106. SEQ ID NO: 106 

Proteinsequenz kodierend fur Oryza sativa Prolamin 

15 107. SEQ ID NO: 107 

Nukleinsauresequenz kodierend fCLr A. sativa Avenin (GenBank 

Acc.-No. : M38446) 

108. SEQ ID NO: 108 
20 Proteinsequenz kodierend fur A. sativa Avenin 

109. SEQ ID NO: 109 

Nukleinsauresequenz kodierend fttr Hordeum vulgare C-Hordein 

(GenBank Acc.-No. : M36941) 

25 

110. SEQ ID NO: 110 

Proteinsequenz Teil 1 kodierend fur Hordeum vulgare C-Hordein 

111. SEQ ID NO: 111 
30 Proteinsequenz Teil 2 kodierend- fur Hordeum vulgare C-Hordein 

. 112. SEQ ID NO: 112 ' 

Nukleinsauresequenz kodierend fur Triticum aestivum LMW Glu- 
tenin-lDl ( GenBank Acc . -No . : X13 306) 

35 

113. SEQ ID NO: 113 

Proteinsequenz kodierend f\ir Triticum aestivum LMW Glute- 

nin-lDl 

40 114. SEQ ID NO: 114 

Binarer Expressionsvektor fur Agrobakterium vermittelte 
Pflanzentransformation pSUN2-USP. 



45 
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115. SEQ ID NO: 115 

Partielle Nukleinsauresequenz kodierend fur Homogenti- 
sat-1, 2-di oxygenase aus Brassica napus (HGD; EC-Nr.: 
1.13.11.5) 

5 

116. SEQ ID NO: 116 

Nukleinsauresequenz kodierend fiir Homogentisat-1, 2 -di oxyge- 
nase aus Arabidopsis thaliana (HGD; EC-Nr. : 1.13.11.5) 

10 117. SEQ ID NO: 117 

Proteinsequenz kodierend far Homogentisat-1, 2-dioxygenase aus 
Arabidopsis thaliana (HGD; EC-Nr.: 1.13.11.5) 

118. SEQ ID NO: 118 

15 Nukleinsauresequenz kodierend fur Maleylacetoacetatisomerase 

aus Arabidopsis thaliana (MAAI; EC-Nr.: 5.2.1.2. ) 

119. SEQ ID NO: 119 

Proteinsequenz kodierend fiir Maleylacetoacetatisomerase aus 
20 Arabidopsis thaliana (MAAI; EC-Nr.: 5.2.1.2.) 

120. SEQ ID NO: 120 

Nukleinsauresequenz kodierend fiir Fumarylac.etoacetathydrolase 
aus Arabidopsis thaliana (FAAH; EC-Nr.: 3.7.1.2) 

25 

121. SEQ ID NO: 121 

Proteinsequenz kodierend fiir Fumarylacetoacetathydrolase aus 
Arabidopsis thaliana (FAAH; EC-Nr.: 3.7.1.2) 

30 122. SEQ ID NO: 122 

Nukleinsauresequenz kodierend fiir Supressionskonst'rukt 2 
(p3300.1-Tocl59-GFP-RNAi) 



35 123. SEQ ID NO: 123 Oligonukleotidprimer OPN18 

124. SEQ ID NO: 124 Oligonukleotidprimer OPN19 

125. SEQ ID NO: 125 Oligonukleotidprimer OPN20 

40 

126. SEQ ID NO: 126 Oligonukleotidprimer OPN21 
Abbildungen 



45 1. Fig.l: Schematische Darstellung der Speicherprotein-Suppres 
sionskonstrukte . 
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Insert aus Vektor pCR2 . l-sRNAi4 (1) (vgl. Beispiel 2d) und 
pCR2.1-sRNAi8 (2) (vgl. Beispiel 2e) kodierend fiir eine die 
AtCru3-, AtCRB und At2S3-Expression supprimierende dsRNA. 

5 In den beiden Konstrukten sind die tt sense "-Ribonukleotidse- 

quenzen und die komplementaren "antisense'-Ribonukleotidse- 
quenzen (symbolisiert durch auf dem Kopf stehende Buchstaben) 
fiir die einzelnen zu supprimierenden Zielgene <AtCru3; AtCRB, 
At2S3) unterschiedlich angeordnet. Schraffierte Bereiche (II, 
10 12 etc.) stellen Intronsequenzen (Linker) dar. 

2. Fig . 2A-D : Symbolische Darstellung verschiedener dsRNAs in ih- 
rer Sekundarstruktur. 

15 S1-, S2, ... Sin): *s ens e"-Ribonukleot ids equenz 

AS1,AS2, . . .AS(n) : *anti sense "-Ribonukleotidsequenz 
I : Intronsequenz 

Die Anordnung der einzelnen tt sense "-Ribonukleotidsequenzen 
20 und W antisense"-Ribonukleotidsequenzen kann so erfolgen, dass 

zunachst alle "sense "-Ribonukleotidsequenzen aneinander ge- 
reiht werden und so quasi einen "sense "-Strang bilden, wo- 
drauf dann alle u antisense"-Ribonukleotidsequenzen aneinander 
zu einem "antisense" -Strang zusammengef ttgt werden (A und C) . 

25 

Alternativ kann die Anordnung der einzelnen " sense " -Ribonu- 
kleotidsequenzen und "antisense" -Ribonukleotidsequenzen so 
erfolgen, dass Paare von jeweils komplementaren * sense "-Ribo- 
nukleotidsequenzen und "antisense'-Ribonukleotidsequenzen an- 
30 einander gefiigt werden (B und D) . 

"sense "-Ribonukleotidsequenzen und *antisense"-Ribonukleotid- 
sequenzen konnen direkt aneinandergefugt sein (A und B) oder 
aber durch weitere Sequenzen beispielsweise Introns (I) von- 
35 einander getrennt sein (C und D) . 

3. Fig.3A-C: Symbolische Darstellung verschiedener dsRNAs in ih- 
rer Sekundarstruktur. 

40 SI, S2, ... S(n): " s ens e"-Ribonukleot ids equenz 

AS1,AS2, . . .AS(n) : tt ant isense"-Ribonukleot ids equenz 
SP: * SPACER" 

RE: Erkennungss equenz fiir Ribozym 

R: Ribozym 
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n sense ff -Ribonukleotidsequenzen und *antisense"-Ribonukleotid- 
sequenzen konnen durch weitere Sequenzen ("SPACER"; SP) von- 
einander getrennt sein (A) . Der Spacer kann beispielsweise 
eines Erkennungssequenz ftir ein Ribozym sein. Das korrespon- 
dierende Ribozym kann separat exprimiert werden (B) oder aber 
auch ebenfalls von dem Spacer kodiert sein (C) . 

Fig. 4: Abbildung des Supressionskonstrukts mit den entspre- 
chenden Restriktionsenzymschni tts tellen : 

Fig.5A: Identifikation einer Pflanze, die den Albino-Phanotyp 
zeigt (links). Der Phanotyp ist identisch zur ppi2 Mutante, 
die Tocl59 nicht mehr exprimieren kann. Als Kontrolle Pflan- 
zen mit Wildtyp Phanotyp, die parallel gewachsen sind. 

Fig. 5B: Fluoreszenz -Analyse der Pflanzen aus Fig.SA. Anre- 
gung der Fluoreszenz durch Licht im Wellenlangenbereich 
470-490 run. Es wurde dieselbe Vergrosserung gewahlt wie in 
Fig. 5A. 



45 
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Beispiele 

Allgemeine Methoden: 

5 Alle Chemikalien, wenn nicht anders erwahnt, stammen von den Fir- 
men Fluka (Buchs), Merck (Darmstadt), Roth (Karlsruhe), Serva 
(Heidelberg) und' Sigma (Deisenhof en) . Restriktionsenzyme, DNA-mo- 
difizierende Enzyme und Molekularbiologie-Kits wurden von den 
Firmen Amer sham- Pharmacia (Freiburg) , Biometra (Gottingen) , Roche 
10 (Mannheim), New England Biolabs (Schwalbach) , Novagen (Madison, 
Wisconsin, USA) , Perkin-Elmer (Weiterstadt) , Qiagen (Hilden) , 
Stratagen (Amsterdam, Niederlande) , Invitrogen (Karlsruhe)- und 
Ambion (Cambridgeshire, United Kingdom) . Die verwendeten Reagen- 
zieh wurden entsprechend der Angaben des Herstellers eingesetzt. 

15 

Die chemische Synthese von Oligonukleotiden kann beispielsweise, 
in bekannter Weise, nach der Phosphoamiditmethode (Voet, Voet, 2. 
Auflage, Wiley Press New York, Seite 896-897) erfolgen. Die im 
Rahmen der vorliegenden Erfindung durchgefuhrten Klonierungs- 

20 schritte wie z.B. Restriktionsspaltungen, Agarosegelelektropho- 
rese, Reinigung von DNA-Fragmenten, Transfer von Nukleinsauren 
auf Nitrozellulose und Nylonmembranen, Verkmipfen von DNA-Frag- 
menten, Transformation von E. coli Zellen, Anzucht von Bakterien, 
Vermehrung von Phagen und Sequenz analyse rekombinanter DNA werden 

25 wie bei Sambrook et al. (1989) Cold Spring Harbor Laboratory 
Press; ISBN 0-87969-309-6 beschrieben durchgef iihrt . Die Sequen- 
zierung rekombinanter DNA-Molekiile erfolgt mit einem Laserf luo- 
reszenz-DNA-Sequenzierer der Firma ABI nach der Methode von San- 
ger (Sanger et al. (1977) Proc Natl Acad Sci USA 74:5463-5467). 

30 

Beispiel 1: Allgemeine Verfahren 

Die Pflanze Arabidopsis thaliana reprSsentiert ein Mitglied der 
35 hoheren Pf lanzen (Samenpf lanzen) . Diese Pflanze ist eng verwandt 
mit anderen Pf lanzenarten aus der Familie der Cruciferen wie z.B. 
Brassica napus, aber auch mit anderen Pflanzenf ami lien der Diko- 
tyledonen. Aufgrund des hohen Grades an Homologie ihrer DNA-Se- 
quenzen bzw. Polypeptidsequenzen kann Arabidopsis thaliana als 
40 Modellpf lanze fur andere Pf lanzenarten eingesetzt werden. 

a) Anzucht von Arabidopsis Pflanzen 

Die Pflanzen werden entweder auf Murashige-Skoog Medium mit 0,5 % 
45 Saccharose (Ogas et al. (1997) Science 277:91-94) oder auf Erde 
gezogen (Focks & Benning (1998) Plant Physiol 118:91-101). Um 
einheitliche Keimungs- und Bliihzeiten zu erreichen, werden die 
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Samen nach Ausplattieren bzw. Ausstreuen auf Erde zwei Tage bei 4° 
C stratifiziert . Nach der Blute werden die Schoten markiert. Ent- 
sprechend der Markierungen werden dann Schoten mit einem Alter 
von 6 bis 20 Tagen nach der Blute geerntet. 

5 

b) Isolierung von total RNA und poly-A + RNA aus Pflanzen 

Fur die Herstellung von Supressionskonstrukten wird RNA bzw. 
polyA + RNA isoliert. RNA wurde aus Schoten von Arabidopsis Pflan- 

10 zen nach folgender Vorschrift isoliert: Schotenmaterial im. Alter 
von 6 bis 20 Tage nach Bluhte wurde geerntet und in fliissigem 
Stickstoff schockgefroren. Das Material wurde vor der weiteren 
Verwendung bei -80°C gelagert. 75 mg des Materials wurde im ge- 
kuhlten M6rser zu einem feinem Pulver gemahlen und mit 200 pli des 

15 Lysis-Puffers aus dem Ambion RNAqueos-Kit versetzt . Die Isolie- 
rung der totalen RNA wurde dann nach Hers teller angaben durchge- 
fuhrt. Die RNA wurde mit. 50 pl> Elutionspuf f er (Ambion) eluiert 
und die Konzentration durch Absorption einer 1 zu 100 verdttnnten 
Losung am Photometer (Eppendorf ) bei 260 nm bestiramt. 40 ug/ml 

20 RNA entspricht dabei einer Absorption von 1. Die RNA-L6sungen 

wurden mit RNAse freiem Wasser auf eine Konzentration von 1 pg/Mli 
eingestellt. Die Konzentrationen wurden durch Agarosegelelektro- 
phorese uberpruft. Zur Isolierung von polyA+ RNA wurde 
oligo(dT)-Zellulose von Amersham Pharmacia nach Herstellerangaben 

25 verwendet. RNA bzw. polyA+ RNA wurde bei -70°C gelagert. 

c) Konstruktion der cDNA-Bank 

Zur Konstruktion der cDNA-Bank aus Arabidopsis Schoten-RNA wurde 

30 die Erststrangsyn these unter Verwendung von Reverser Transcrip- 
tase aus Maus-Leukamie-Virus (Clontech) und Oligo-d(T) -Priraern, 
die Zweitstrangsynthese durch Inkubation mit DNA-Polymerase I, 
Klenow-Enzym und RNAse H-Spaltung bei 12°C (2 Std. ) , 16°C (1 Std. ) 
und 22°C (1 Std.) erzielt. Die Reaktion wurde durch Inkubation 

35 bei 65°C (10 min) gestoppt und anschliefiend auf Eis uberfuhrt. 
Doppelstrangige DNA-Molekiile wurde mit T4 -DNA-Polymerase (Ro- 
che, Mannheim) bei 37°C (30 min) mit glatten Enden versehen. Die 
Nukleotide wurden durch Phenol/Chloroform-Extraktion und Sepha- 
dex-G50-Zentrifugiersaulen entfernt. EcoRI/XhoI- Adapter (Pharma- 

40 cia, Freiburg, Deutschland) wurden mittels T4-DNA-Ligase (Roche, 
12°C, uber Nacht) an die cDNA-Enden ligiert, mit Xhol nachge- 
schnitten und durch Inkubation mit Polynukleotidkinase (Roche, 
37°C, 30 min) phosphoryliert . Dieses Gemisch wurde der Trennung 
auf einem Low-Melting-Agarose-Gel unterworfen. DNA-Mo 1 eku 1 e uber 

45 300 Basenpaaren wurden aus dem Gel eluiert, Phenol-extrahiert, 
auf Elutip-D-Saulen (Schleicher und Schiill, Dassel, Deutschland) 
konzentriert und an Vektorarme ligiert und in lambda-ZAPII-Phagen 
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oder lambda-ZAP-Express-Phagen unter Verwendung des Gigapack 
Gold-Kits (Stratagene, Amsterdam, Niederlande) verpackt, wobei 
Material des Herstellers verwendet und seine Anweisungen befolgt 
wurden . 

5 

d) Isolierung von genomischer DNA aus Pflanzen wie Arabidopsis 
thaliana oder Brassica napus ( CTAB-Methode ) 

Zur Isolierung genomischer DNA aus Pflanzen wie Arabidopsis tha- 

10 liana oder Brassica napus werden ca. 0,25 g Blattmaterial junger 
Pflanzen im vegetativen Stadium in flussigem Stickstoff zu feinem 
. Pulver gemorsert. Das pulverisierte Pf lanzenmaterial wird zusam- 
men mit 1 ml 65°C-warmem CTAB I-Puffer (CTAB: Hexadecyltrimethy- 
lammoniuinbromid, auch genannt Cetyltrimethylammoniumbromid; Sigma 

15 Kat.-Nr.: H6269) und 20 |Xl fi-Mercaptoethanol in einen vorgewarm- 
ten zweiten M6rser geg'eben und nach vollstandiger Homogenisierung 
wird der Extrakt in ein 2 ml Eppendorf-Gef&£ iiberfuhrt und fur 1 
h bei 65°C unter regelm&£iger , vorsichtiger Durchmischung inku- 
biert. Nach Abkuhlung auf Raumtemperatur wird der Ansatz mit 1 ml 

20 Chloroform/Octanol (24:1, mit 1M Tris/HCl, pH 8,0 ausgeschiittelt) 
durch langsames • Invertieren extrahiert und zur Phasentrennung ftir 
5 min bei 8,500 rpm (7,500 x g) und Raumtemperatur zentrifugiert . 
Anschliefeend wird die wassrige Phase erneut mit 1 ml Chloroform/ 
Octanol extrahiert, zentrifugiert und durch Invertieren mit 1/10 
. 25 Volumen auf 65°C vorgewSrmtem CTAB II-Puffer sorgfaltig gemischt. 
AnschlieSend wird der Ansatz durch vorsichtiges Schwenken mit 1 
ml Chlorof orm/Octanol-Gemisch (siehe oben) versetzt und zur er- 
neuten Phasentrennung fur 5 rain bei 8,500 rpm (7,500 x g) und 
Raumtemperatur zentrifugiert. Die Wclssrige untere Phase wird in 

30 ein frisches Eppendorf-Gef iiberfuhrt und die obere organische 
Phase wird in einem frischen Eppendorf -Gef&£ erneut fur 15 min 
bei 8,500 rpm (7,500 x g) und Raumtemperatur zentrifugiert. Die 
hieraus resultierende wassrige Phase wird mit der wassrigen Phase 
des vorherigen Zentrifugationsschrittes vereinigt und der gesamte 

35 Ansatz mit exakt demselben Volumen vorgewarmtem CTAB Ill-Puffer 
versetzt. Es folgt eine Inkubation bei 65°C, bis die DNA in 
Flocken ausfallt. Dies kann bis zu 1 h dauern oder durch Inku- 
bation bei 37°C uber Nacht erfolgen. Das aus dem anschlieSenden 
Zentrifugationsschritt (5 min, 2000 rpm (500 x g) , 4°C) resul- 

40 tierende Sediment wird mit 250 )Jl auf 65°C vorgewaanntem CTAB 
IV-Puffer versetzt und fur mindestens 3 0 min bzw. bis zur voll- 
standigen AuflSsung des Sediments bei 65°C inkubiert. Anschliefiend 
wird die Losuxtg zur Fallung der DNA mit 2,5 Volumina eiskaltem 
Ethanol vermischt und fxir lh bei -20°C inkubiert. Alternativ 

45 kann der Ansatz mit 0.6 Volumina Isopropanol vermischt und ohne 
weitere Inkubation sofort fur 15 min bei 8,500 rpm (7,500 x g) 
und 4°C zentrifugiert werden. Die sedimentierte DNA wird durch 
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Invertieren des Eppendorf-Gef a£es zweimal mit je 1 ml 80%igem 
eiskaltem Ethanol gewaschen, nach jedem Waschschritt erneut zen- 
trifugiert (5 min, 8,500 rpm (7,500 x g) , 4°C) und anschliefcend 
fur ca. 15 min luf tgetrocknet . Abschliefeend wird die DNA in 
5 100 |il TE mit 100 Jig/ml RNase resuspendiert und fur 30 min bei 
Raumtemperatur inkubiert. Die DNA L6sung ist nach einer weiteren 
Inkubationsphase iiber Nacht bei 4°C homogen und kann fiir weiter- 
ftihrende Experimente .verwendet werden. . 

10 Losungen fiir CTAB: 

L6sung I (fiir 200 ml) : 

100 mM Tris/HCl pH 8,0 (2,42 g) 
1,4 M NaCl (16,36 g) 
15 20 mM EDTA (8,0 ml von 0,5 M Stammlosung) 

2 %(w/v) CTAB (4,0 g) 

Jeweils vor der Verwendung werden frisch zugesetzt: 
2 % £-Mercaptoethanol (20 pi fiir 1 ml Losung I) . 

20 

Losung II (fiir 200 ml) : 
0,7 M NaCl (8,18 g) 
10 %(w/v) CTAB (20 g) 

25 Losung III (fiir 200 ml): 

50 mM Tris/HCl pH 8,0 (1,21 g) 

10 mM EDTA (4 ml 0,5 M von 0,5 M Stammlosung) 

1 %(w/v) CTAB (2,0 g) 

30 L6sung IV (High-salt TE) (fiir 200 ml): 
10 mM Tris/ HC1 pH 8,0 (0,242 g) 
0,1 mM EDTA (40 )Il 0.5 M Stammlosung) 
1 M NaCl (11, 69 g) 

35 Chloroform/Octanol (24:1) (fiir 200. ml): 
192 ml Chloroform 
8 ml Octanol 

Die Mischung wird 2x mit 1 M TrisHCl pH 8,0 ausgeschuttelt 
und vor Licht geschiitzt gelagert. 

40 

Beispiel 2: Herstellung von Suppress ionskonstruk ten 

Ausgehend von der genomischer Arabidopsis thaliana DNA oder cDNA 
wurden iiber PCR mittels der aufgefiihrten Oligonukleotide folgende 
45 Fragmente von Speicherproteinsequenzen amplif iziert . Dabei kam 
nachfolgendes PCR Protokoll zum Einsatz: 
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Zusammensetzung des PCR-Ansatzes (50 \1L) : 

5,00 pli Template cDNA oder genomische DNA (ca. 1 jig) 
5,00 \ih lOx Puffer (Advantage-Polymerase) + 25 mM MgCl2 
5 5,00 \jlL 2mM dNTP 

1,25 [XL je Primer (10 pmol/[iL) 

0,50 pi Advantage-Polymerase (Clontech) 

PCR-Programm: Anf angsdenaturierung ftir 2 min bei 95°C, dann 35 Zy- 
10 klen mit 45. sec 95°C, 45 sec 55°C und 2 min 72°C. Abschliessende 
Extension von 5 min bei 72°C. 

a) Ausgangsvektor pCR2 . l-AtCRU3-RNAi 

15 Aus genomischer Arabidopsis thaliana DNA wird mit nachf olgendem 
Oligonukleo'tid-Primerpaar- ein Exonbereich mit dem vollstandigen 
anschlieSenden Intron einschlieJSlich der an das Intron anschlie- 
fcenden Splei£-Akzeptorsequenz des 12S Speicherprotein AtCRU3 
(Basenpaar 1947 bis 2603 der Seguenz mit der GenBank Acc.-No: 

20 U66916) amplif iziert : 

ONP1 (SEQ ID NO: 134) : 

5 1 - ATAAGAATGCGGCCGCGTGTTCC ATTTGGCCGGAAACAAC - 3 ' 

25 ONP2 (SEQ ID NO: 135): 

5 x -CCCGGATCCTTCTGTAACATTTGACAAAACATG-3 ' 

Das PCR-Produkt wird in den pCR2 . l-TOPO Vektor (Invitrogen) ge- 
mass Herstellerangaben kloniert, result ierend in dem pCR2.1-l 
30 Vektor und die Sequenz tiberprtift. 

Ftir die den antisense-Strang der dsRNA kodierende Sequenz wird 
aus Arabidopsis thaliana cDNA lediglich das gleiche Exon wie oben 
(Basenpaar 1947 bis 2384) mit dem nachf olgenden Primerpaar ampli- 
35 f iziert: 

ONP3 (SEQ ID NO: 136) : 

5 x AT AAGAATGC GGC C GC GTGTTC C ATTTGGC C GGAAAC AAC - 3 ' 

40 ONP4 (SEQ ID NO: 137): 

5 x ATAAGAATGCGGCCGC GGATCC ACC CTGGAGAACGCCACGAGTG- 3 ' 

Das PCR-Produkt wird in den pCR2. l-TOPO Vektor (Invitrogen) ge- 
mass Herstellerangaben kloniert, resultierend in dem pCR2.1-2 
45 Vektor und die Sequenz tiberprtift. 
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0,5 jig von Vektor pCR2.1-l werden mit dem Restriktionsenzym BamHI 
(New England Biolabs) fur 2. Stunden nach Herstellerangaben inku- 
biert und dann fur 15 min mit alkalischer Phosphatase (New Eng- 
land Biolabs) dephosphoryliert . Der so praparierte Vektor (1 plj) 
5 wird dann mit dem aus Vektor pCR2.1-2 gewonnenen Fragment li- 
giert. Dazu werden 0,5 Jig von Vektor pCR2.1-2 2 Stunden mit BamHI 
(New England Biolabs) verdaut und die DNA-Fragmente per Gelelek- 
torphorese aufgetrennt. Das neben dem Vektor (3,9 kb) entstandene 
489 bp grosse Stiick wird aus dem Gel ausgeschnitten und mit dem 

10 "Gelpurif ication"-Kit (Qiagen) nach Herstellerangaben aufgerei- 
nigt und mit 50 \ih Elutionspuf f er eluiert. 10 (XL des Eluats werden 
mit Vektor pCR2.1-l (s.o.) iiber Naeht bei 16°C ligiert (T4 Ligase, 
New England Biolabs) . Die Ligationsprodukte werden dann in TOPlO 
Zellen (Stratagene) nach Herstellerangaben transf ormiert und ent- 

15 sprechend selektioniert . Positive Klone werden mit dem Primerpaar 
ONP1 und ONP2 durch PCR verifiziert. Der. erhaltene Vektor wird 
pCR2.1-AtCRU3-RNAi genannt. Die fur die dsRNA kodierdende Nu- 
kleinsaureseguenz ist durch SEQ ID NO: 105 beschrieben. 

20 b) Ausgangsvektor pCR2 . 1-AtCRB-RNAi 

Mit nachf olgendem Oligonukleotid-Primerpaar wird ein Exonbereich 
des 12S Speicherprotein AtCRB (SEQ ID NO: 117 bzw. 118; Basenpaar 
601 bis 1874 der Sequenz mit der GenBank Acc.-No: M37248) aus 
25 Arabidopsis thaliana cDNA amplif iziert : 

ONP5 (SEQ ID NO: 138) : 

5 ' ATAAGAATGCGGCCGCGGATCCCTCAGGGTCTTTTCTTGCCCACT-3 ' 

30 ONP6- (SEQ ID NO: 139): 

5 1 -CCGCTCGAGTTTACGGATGGAGCCACGAAG-3 ' 

Das PCR-Produkt wird in den pCR2.1-T0P0 Vektor (Invitrogen) • ge- 
mass Herstellerangaben kloniert, resultierend in dem pCR2.1~3 
35 Vektor und die Sequenz uberpriift. 

Fiir den als Linker fungierenden Bereich wird aus Arabidopsis tha- 
liana genomischer DNA ein Intron mit den entsprechenden Spliceak- 
zeptor und -donorsequenzen der f lankierenden Exons (Basenpaar 
1874 bis 2117 der Sequenz mit der GenBank Acc.-No: M37248) mit 

4 0 

dem nachf olgenden Primerpaar amplif iziert : 

0NP7 (SEQ ID NO: 140) : 

5 % — CCGCTCGAGGTAAGCTCAAC AAATCTTTAG- 3 ' 



ONP8 (SEQ ID NO: 141) : 

5 1 -ACGCGTCGACGCGTTCTGCGTGCAAGATATT-3 ' 
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Das PCR-Produkt wird in den pCR2.1-T0P0 Vektor (Invitrogen) ge- 
m&ss Herstellerangaben kloniert, resultierend in dem pCR2.1-4 
Vektor und die Sequenz iiberpruft. 

Das Konstrukt fiir AtCRB wird in einer ahnlichen Strategie wie fur 
AtCRU3 erlautert, erstellt. Vektor pCR2 . 1-3 wird mit mit Xhol 
(New England Biolabs) fur 2 Stunden inkubiert und dephosphory- 
liert (alkalische Phosphatase, New England Biolabs) . Vektor 
PCR2.1-4 wird ebenfalls mit Xhol in derselben Weise inkubiert und 
die Gelfragmente per Gelelektrophorese aufgetrennt. Die entspre- 
chenden Fragmente werden in der unter AtCRU3 beschriebenen Art 
und Weise aufgereinigt und ligiert, resultierend nach Bakterien- 
transformation in dem Vektor pCR2 . 1 -AtCRB Exon/Intron. Dieser 
Vektor wird fiir 2 Stunden mit Xbal (NEB) , anschliessend ftir 15 
min mit Klenow-Fragment (NEB) , dann fiir 2 Stunden mit Sail inku- 
biert und zuletzt 15 min mit alkalischer Phosphatase (NEB) behan- 
delt. Parallel wird der Vektor pCR2.1-3 mit BamHI (NEB), dann 15 
min mit- Klenow-Fragment und anschliessend 2 Stunden- mit Xhol 
(NEB) inkubiert. Das Exon-Fragment von AtCRB wird nach Gelelek- 
torphorese isoliert, gereinigt und zur Ligation eingesetzt. Beide 
Fragmente wurden dann ligiert und der Vektor pCR2 . 1-AtCRB-RNAi 
resultierte. Der erhaltene Vektor wird pCR2 . 1-AtCRB-RNAi genaimt. 
Die fur die dsRNA kodierdende Nukleinsauresequenz ist durch SEQ 
ID NO: 107 beschrieben. 

c) Ausgangsvektor pCR2 . l-At2S3-RNAi . 

Mit nachf olgendem Oligonukleotid-Primerpaar wird ein Exonbereich 
des 2S Speicherprotein At2S3 (SEQ ID NO: 3 bzw. 4; Basenpaar 212 
bis 706 der Sequenz mit der GenBank Acc.-No: M22035) amplifi- 
ziert : 

ONP9 (SEQ ID NO: 142) : 

5 1 -ATAAGAATGCGGCCGCGGATCCATGGCTAACAAGCTCTTCCTCGTC-3 ' 

35 ONP10 (SEQ ID NO: 143): 

5 1 -ATAAGAATGCGGCCGCGGATCCCTAGTAGTAAGGAGGGAAGAAAG-3 ' 

Das PCR-Produkt wird in den pCR2.1-T0P0 Vektor (Invitrogen) ge- 
mass Herstellerangaben kloniert, resultierend in dem pCR2.1-5 
40 Vektor und die Sequenz uberpruft. Fur den als Linker fungierenden 
Bereich wird das gleiche Intron wie unter b) mit den Primern OPN 
7 und OPN 8 amplifiziert eingesetzt. 

Das Konstrukt fiir At2S3 wird in einer ahnlichen Strategie wie fur 
45 AtCRU3 erlSutert, erstellt. Vektor pCR2.1-5 wird mit mit Xhol 
(New England Biolabs) fur 2 Stunden inkubiert und dephosphory- 
liert (alkalische Phosphatase, New England Biolabs). Vektor 
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pCR2.1-3 werden ebenfalls mit Xhol in derselben Weise inkubiert 
und die Gelfragmente per Gelelektrophorese aufgetrennt. Die ent- 
sprechenden Fragmente werden in der unter AtCRU3 beschriebenen 
Art und Weise aufgereinigt und ligiert, resultierend nach Bakte- 
5 rientrans formation in dem Vektor pCR2.1-At2S3 Exon/Intron. Dieser 
Vektor wird fur 2 Stunden mit Sail (NEB) , anschliessend fur 15 
min mit Kl enow-Fragment (NEB) inkubiert und zuletzt 15 min mit al- 
kalischer Phosphatase (NEB) behandelt. Parallel wird der Vektor 
pCR2.1-5 mit BamHI (NEB) und dann 15 min mit Kl enow-Fragment in- 
10 kubiert. Das Exon-Fragment von At2S3 wird nach Gelelektorphorese 
isoliert, gereinigt und zur Ligation eingesetzt. Beide Fragmente 
werden dann ligiert und der Vektor pCR2 . l-At2S3-RNAi resultierte. 
Die fur die dsRNA kodierdende Nukleinsauresequenz ist durch SEQ 
ID NO: 109 beschrieben. 

15 

d) Herstellung von Super-Supressionskonstrukt 1 

Die Vektoren pCR2 . l-AtCRU3-RNAi und pCR2.1-4 (siehe oben) werden 
mit den Res tr ikt ions enzymen Xhol und Sail ftir 2 Stunden bei 37°C 

20 inkubiert, die DNA-Fragmente durch Agarose-Gelelektrophorese auf- 
getrennt und sowohl der Vektor als auch das PCR- Insert aus 
pCR2.1-4 ausgeschnitten und mit dem "Gelpurif ication"-Kit von 
Qiagen nach Herstellerangaben aufgereinigt und mit 50 \ih Eluti- 
onspuffer eluiert. Vom Vektor wird 1 \lh f vom PCR-Insert aus 

25 pCR2.1-4 8 jLLL der Eluate ftir die Ligation eingesetzt, resultie- 
rend in dem Konstrukt pCR2 . 1-sRNAil . Dieser Vektor wird fttr 2 
Stunden mit dem Restriktionsenzym Xhol und dann fur 15 min mit 
Kl enow-Fragment inkubiert. 

30 Der Vektor pCR2 . 1-AtCRB-RNAi (siehe oben) wird mit dem Enzym 
EcoRI ftir 2 Stunden inkubiert und ebenfalls 15 min mit Klenow- 
Fragement behandelt. Beide Inkubationsansatze werden durch Gel- 
elektrophorese aufgetrennt und jeweils der Vektor (pCR2 . 1-sRNAil) 
bzw. das Insert (aus pCR2 . 1-AtCRB-RNAi) aus dem Agarosegel ausge- 

35 schnitten und die DNA-Fragmente wie oben beschrieben aufgerei- 
nigt. Ftir die Ligation werden 1 [IL des Eluates vom Vektor und 8 \XL 
des Eluates vom Insert eingesetzt und bei 4°C tlber Nacht inku- 
biert. Das resultierende Konstrukt wird mit pCR2 . l-sRNAi2 be- 
zeichnet. Der resultierende Vektor wird mit dem Enzym Xbal und 

40 anschliessend mit Kl enow- Fragment inkubiert. Der Vektor pCR2.1-4 
wird mit den Enzymen EcoRV und Xbal und anschliessend mit Klenow- 
Fragment inkubiert. Nach Gelelektrophorese und -reinigung wird 
das Fragment aus pCR2.1-4 mit dem Vektor pCR2 . 1-SRNM2 ligiert, 
resultierend in dem Konstrukt pCR2 . l-sRNAi3 . Der resultierende 

45 Vektor wird dann mit dem Enzym Apal fiir 2 Stunden und dann mit 
Klenow-Fragment fiir 15 min inkubiert. Als Insert wird der Vektor 
pCR2 .l-At2S3-RNAi mit dem Enzym EcoRI fur 2 Stunden und dann mit 
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Klenow-Fragment fur 15 min inkubiert. Nach Gelelektrophorese und 
-reinigung werden die Eluate ligiert, resultierend in dem Vektor 
pCR2 . l-sR3SIAi4 . Aus diesem Vektor wird dann das sRNAi4-Fragment 
(SEQ ID NO: 144; vgl . Fig. 1(D), kodierend fur die super-suppri- 
5 mierende dsRNA, durch Inkubation mit Hindlll .und Pvul ausge- 

schnitten und in den binaren Vektor pSUN-USP (SEQ ID NO: 179) li- 
giert. Das Konstrukt dient der gleichzeitigen Suppression von 
Arabidopsis thaliana Speicherproteinen CRB (SEQ ID NO: 4), CRU3 
(SEQ ID NO: 112) und At2S3 (SEQ ID NO: 118). 

10 

Der verwendete Vektor pSUN-USP ist ein binarer Vektor zur Pflan- 
zentransformation auf Basis von pBinAR (H6fgen und Willmitzer 
(1990) Plant Science 66: 221-230). Eine gewebespezif ische Expres- 
sion Im Samen la£t sich unter Verwendung des gewebespezif ischen 
15 Promo tors USP-Promotors erzielt. 

e) ' Herstellung von Super-Supressionskonstrukt 2 

Ausgehend von Arabidopsis thaliana cDNA wird ein Fragment aus dem 
20 Speicherprotein AtCRU3 (SEQ ID NO: 111, 112) mit dem nachfolgen- 
den Oligonukleotid-Primerpaar unter den in Beispiel 2 angegebenen 
PCR-Bedingungen amplif iziert : 

OPN 11: 5 * -AAAAGGCCTGTGTTCCATTTGGCCGGAAACAAC-3 ' (SEQ ID NO: 148) 
25 OPN 12: 5 x -AAAGATATCACCCTGGAGAACGCCACGAGTG-3 ' (SEQ ID NO: 149). 

Das erhaltene Fragment wird in den Vektor pCR2.1-TOPO Vektor (In- 
vitrogen) gem^ss Herstellerangaben kloniert, resultierend in den 
pCR2.1-6 und die Sequenzen uberprtift. 

30 

Ausgehend von Arabidopsis thaliana cDNA wird ein Fargment aus dem 
Speicherprotein At2S3 (SEQ ID NO: 3, 4) mit dem nachf olgenden 
Oligonukleotid-Primerpaar unter den in Beispiel 2 angegebenen 
PCR-Bedingungen amplif iziert : 

35 

OPN 13: 5 * -AAAAGGCCTATGGCTAACAAGCTCTTCCTCGTC--3 ' (SEQ ID NO: 150) 
OPN 14: 5 1 -AAAGATATCCTAGTAGTAAGGAGGGAAGAAAG-3 ' (SEQ ID NO: 151). 

Das erhaltene Fragment wird in den Vektor pCR2.1-TOPO Vektor (In- 
40 vitrogen) gemass Herstellerangaben klohiert, resultierend in den 
pCR2.1-7 und die Sequenzen ttberpruft. 

Aus den pCR2.1-3, pCR2.1-4 (siehe Beispiel 2) und pCR2 . 1-6 und 
PCR2.1-7 werden dann die Konstrukte f olgendermassen zusammen li- 
45 giert: Der Vektor pCR2 . 1-3 wird 2 Stunden mit EcoRV inkubiert und 
anschliessend 15 min mit alkalischer Phosphatase dephosphory- 
liert. Der Vektor pCR2.1-6 wird mit den Enzymen StuI' und EcoRV 
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fur 2 Stunden inkubiert und das PCR-Insert uber Gelelektrophorese 
und -reinigung isoliert. Vektor pCR2.1-3 und Insert axis pCR2 . 1-6 
werden dann .tiber Nacht bei 4°C ligiert, resultierend in dem Kon- 
strukt pCR2 . l-sRNAi5 . Dieser Vektor wird dann mit EcoRV inkubiert 
5 und dephosphoryliert und mit dem StuI/ EcoRV inkubierten und ge- 
laufgereinigten Fragment aus pCR2.1-7 ligiert, resultierend in 
dem Konstrukt pCR2 . l-sRNAi6 . Dieser Vektor wird dann mit Xhol in- 
kubiert und dephosphoryliert. Der Vektor pCR2.1-4 wird mit Sail 
und Xhol inkubiert und das Insert aus pCR2.1-4 mit dem vorberei- 
10 teten Vektor pCR2 . l-sRNAi6 ligiert, resultierend in dem Konstrukt 
pCR2 .l-sRNAi7 . Ausgehend von pCR2 . l-sRNAi7 wird eine PCR mit den 
nachfolgenden Primerpaar unter den in Beispiel 2 gegebenen Bedin- 
gungen durchgeflihrt : 

15 OPN 15: 5' CCGCTCGAGCTCAGGGTCTTTTCTTGCCCACT (SEQ ID NO: 152) 
OPN 16: 5 1 -CCGGTCGACCTAGTAGTAAGGAGGGAAGAAAG . (SEQ ID NO- 153) . 

Das resultierende PCR-Produkt wird mit den Enzymen Xhol und Sail 
inkubiert. Das Fragment wird dann in den Vektor pCR2 . l-sRNAi7 

20 (inkubiert mit Xhol) ligiert, resultierend in dem Konstrukt 

pCR2.1-sRNAi8. Aus diesem Vektor wird dann das sRNAi 8 -Fragment * 
(SEQ ID NO: 146; vgl . Fig. 1(2)), kodierend fttr die super-suppri- 
mierende dsRNA, durch Inkubation mit Hindlll und Xbal ausge- 
schnitten und in den binaren Vektor pSUN-USP (SEQ ID NO: 179) li- 

25 giert. Das Konstrukt dient der gleichzeitigen Suppression von 
Arabidopsis thaliana Speicherproteinen CRB (SEQ ID NO: 4), CRU3 
(SEQ ID NO: 112) und At2S3 (SEQ ID NO: 118). 

Beispiel 3: Transformation von Agrobacterium 

30 

Die Agrobacterium-vermittelte Pflanzentrans formation kann zum 
Beispiel unter Verwendung der Agrobacterium tumef aciens-Stamme 
GV3101 (pMP90) (Koncz und Schell (1986) Mol Gen Genet 204: 383- 
396) Oder LBA4404 (Clontech) durchgefiihrt werden. Die Transfor- 
35 mation kann durch Standard-Trans format ions techniken durchgefiihrt 
werden (Deblaere et al. (1984) Nucl Acids Res 13:4777-4788). 

Beispiel 4: Pflanzentrans formation 

40 Die Agrobacterium-vermittelte Pflanzentrans format ion kann unter 
Verwendung von Standard-Transformations- und Regenerationstechni- 
ken durchgefuhrt werden (Gelvin, Stanton B. , Schilperoort , Robert 
A., Plant Molecular Biology Manual, 2. Aufl., Dordrecht: Kluwer 
Academic Publ., 1995, in Sect., Ringbuc Zentrale Signatur: BT11-P 

45 ISBN 0-7923-2731-4; Glick, Bernard R. r Thompson, John E. , Methods 
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in Plant Molecular Biology and Biotechnology, Boca Raton: CRC 
Press, 1993, 360 S., ISBN 0-8493-5164-2). 

Die Transformation mittels Agrobacterium von Arabisopsis thaliana 
5 wird durch die Methode nach Bechthold et al., 1993 (C.R. Acad. 
Sci. Ser. Ill Sci. Vie., 316, 1194-1199) durchgefiihrt . 
Beispielsweise kann Raps mittels Kotyledonen- oder Hypokotyl- 
trans formation transformiert werden (Moloney et al., Plant Cell 
Report 8 (1989) 238-242; De Block et al., Plant Physiol. 91 
10 (1989) 694-701). Die Verwendung von Antibiotika fur die Agrobac- 
terium- und Pf lanzenselektion hSngt von dem fur die Transforma- 
tion verwendeten binaren Vektor und Agrobacterium-Stamm ab. Die 
Rapsselektion wird gew6hnlich unter Verwendung von Kanamycin als 
selektierbarem Pf lanzenmarker durchgefiihrt . 

15 

Der Agrobacterium-vermittelte Gentransfer in Lein (Linum usita- 
tissimum) ia£t sich unter Verwendung von beispielsweise einer von 
Mlynarova et al. (1994) Plant Cell Report 13:282-285 beschriebe- 
nen Technik durchfuhren. 

20 

Die Transformation von Soja kann unter Verwendung von beispiels- 
weise einer in EP-A-0 0424 047 (Pioneer Hi-Bred International) 
oder in EP-A-0 0397 687, US 5,376,543, US 5,169,770 (University 
Toledo) beschriebenen Technik durchgefiihrt werden. 

25 

Die Pflanzentransformation unter Verwendung von Teilchenbe- 
schuE, Polyethylenglycol-vermittelter DNA-Aufnahme oder tiber die 
Siliziumcarbonatfaser-Technik ist beispielsweise beschrieben 
von Freeling und Walbot "The maize handbook" (1993) ISBN 
30 3-540-97826-7, Springer Verlag New York). 

Beispiel 5: Untersuchung . der Expression eines rekombinanten 
Genproduktes in einem trans formier ten Organismus 

35 Die Aktivitat eines rekombinanten Genproduktes im trans formier ten 
Wirtsorganismus wurde auf der Transkriptions- und/oder der 
Translationsebene gemessen. 

Ein geeignetes Verfahren zur Best immung der Menge an Transkrip- 
40 tion des Gens (ein Hinweis auf die Menge an RNA, die fttr die 
Tranlation des Genproduktes zur Verfugung steht) ist die Durch- 
fuhrung eines Northern-Blots wie unten ausgefiihrt (als Bezugs- 
stelle siehe Ausubel et al. (1988) Current Protocols in Molecular 
Biology, Wiley: New York, oder den oben erwahnten Beispielteil) , 
45 wobei ein Primer, der so gestaltet ist, da£ er an das Gen von In- 
teresse bindet, mit einer nachweisbaren Markierung (gewohnlich 
radioaktiv oder chemilumineszent) markiert wird, so dafi, wenn die 
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Gesamt-RNA einer Kultur des Organismus extrahiert, auf einem Gel 
aufgetrennt, auf eine stabile Matrix trans feriert und mit dieser 
Sonde inkubiert wird, die Bindung und das AusmaS der Bindung der 
Sonde das Vorliegen und auch die Menge der mRNA fur dieses Gen 
5 anzeigt. Diese Information zeigt den Grad der Transkription des 
trans formier ten Gens an. Zellulare Gesamt-RNA kann aus Zellen, 
Geweben Oder Organen mit mehreren Verfahren, die alle im Fachge- 
biet bekannt sind, wie zum Beispiel das von Bormann, E.R., et al. 
(1992) Mol. Microbiol. 6:317-326 beschriebene, prapariert werden. 

10 

Northern-Hybridisierung : 

Fur die RNA-Hybridisierung wurden 20 fig Gesamt-RNA oder 1 jig 
poly(A) + -RNA mittels Gelelektrophorese in Agarosegelen mit ei- 
ner Starke von 1,25 %. unter Verwendung von Formaldehyd, wie be- 

15 schrieben in Amasino (1986, Anal. Biochem. 152, 304) aufgetrennt, 
mittels Kapillaranziehung unter Verwendung von 10 x SSC auf posi- 
tiv geladene Nylonmembranen (Hybond N+, Amersham, Braunschweig) 
ubertragen, mittels UV-Licht immobilisiert und 3 Stunden bei 68°C 
unter Verwendung von Hybridisierungspuf f er (10 % Dextransulf at 

20 Gew./Vol., 1 M NaCl, 1.% SDS, 100 mg Heringssperma-DNA) vorhybri- 
disiert. Die Markierung der DNA-Sonde mit dem Highprime DNA labe- 
ling-Kit (Roche, Mannheim, Deutschland) erfolgte wahrend der Vor- 
hybridisierung unter Verwendung von alpha- 3 2 P-dCTP (Amersham Phar- 
macia, Braunschweig, Deutschland) . Die Hybridisierung wurde nach 

25 Zugabe der markierten DNA-Sonde im gleichen Puffer bei 68°C tiber 
Nacht durchgefuhrt. Die Waschschritte wurden zweimal far 15 min 
unter Verwendung von 2 X SSC und zweimal far 30 min unter Verwen- 
dung von 1 X SSC, 1 % SDS, bei 68°C durchgefuhrt. Die Exposition 
der verschlossenen Filter wurde bei -70°C fur einen Zeitraum von 1 

30 bis 14 T durchgef ahrt . 

Zur Untersuchung des Vorliegens oder der relativen Menge an von 
dieser mRNA translatiertem Protein konnen Standardtechniken, wie 
ein Western-Blot, eingesetzt werden (siehe beispielsweise Ausubel 

35 et al. (1988) Current Protocols in Molecular Biology, Wiley: 

New York) . Bei diesem Verfaihren werden die zellularen Gesamt-Pro- 
teine extrahiert, mittels Gelelektrophorese aufgetrennt, auf eine 
Matrix, wie Nitrozellulose, ubertragen und mit einer Sonde, wie 
einem AntikSrper, der spezifisch an das gewunschte Protein bin- 

40 det, inkubiert. Diese Sonde ist gewohnlich mit einer chemilumi- 
neszenten oder kolorimetrischen Markierung versehen, die sich 
leicht nachweisen laSt. Das Vorliegen und die Menge der beobach- 
teten Markierung zeigt das Vorliegen und die Menge des gewunsch- 
ten, in der Zelle vorliegenden mutierten Proteins an. 
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Beispiel 6: Analyse der Auswirkung der rekombinanten Proteine 
auf die Produktion des gewtinschten Produktes 

Die Auswirkung der genetischen Modifikation in Pflanz-en, Pilzen, 
5 Algen, Ciliaten oder auf die Produktion einer gewCinschten Verbin- 
dung (wie einer Fettsaure) kann bestimmt werden, indem die modi- 
fizierten Mikroorganismen oder die modif izierte Pflanze unter ge- 
eigneten Bedingungen (wie den vorstehend beschriebenen) gezuchtet 
werden und das Medium und/oder die zellularen Komponenten auf die 

10 erhohte Produktion des gewiinschten Produktes (d.h. von Lipiden 
oder einer Fettsaure) untersucht wird. Diese Analysetechniken 
sind dem Fachmann bekannt und umfassen Spektroskopie,' Dunn- 
schichtchromatographie, FSrbeverf ahren verschiedener Art, enzyma- 
tische und mikrobiologische Verfahren sowie analytische Chromato- 

15 graphie, wie Hochleistungs-Flussigkeitschromatographie (siehe 
beispielsweise Ullman, Encyclopedia of Industrial Chemistry, Bd. 
A2, S. 89-90 und S. 443-613, VCH: Weinheim (1985); Fallon, A., et 
al., (1987) "Applications of HPLC in Biochemistry" in: Laboratory 
Techniques in Biochemistry and Molecular Biology, Bd. 17; Rehm et 

20 al. (1993) Biotechnology, Bd. 3, Kapitel III: "Product recovery 
and purification" , S. 469-714, VCH: Weinheim; Belter, P. A., et 
al. (1988) Bioseparations: downstream processing for Biotechno- 
logy, John Wiley and Sons; Kennedy, J.F., und Cabral, J. M.S. 
(1992) Recovery processes for biological Materials , John Wiley 

25 and Sons; Shaeiwitz, J. A. , und Henry, J.D. (1988) Biochemical Se- 
parations, in: Ullmann's Encyclopedia of Industrial Chemistry, 
Bd. B3; Kapitel' 11, S. 1-27, VCH: Weinheim; und Dechow, F.J. 
(1989) Separation and purification techniques in biotechnology, 
Noyes Publications). 

30 

Neben den oben erwsihnten Verfahren werden Pf lanzenlipide aus 
Pflanzenmaterial wie von Cahoon et al . (1999) Proc. Natl. Acad. 
Sci. USA 96 (22) : 12935-12940 , und Browse et al. (1986) Analytic 
Biochemistry 152:141-145, beschrieben extrahiert. Die qualitative 

35 und quantitative Lipid- oder FettsSureanalyse ist beschrieben 
bei Christie, William W., Advances in Lipid Methodology, Ayr/ 
Scotland: Oily Press (Oily Press Lipid Library; 2); Christie, 
William W. , Gas Chromatography and Lipids. A Practical Guide - 
Ayr, Scotland: Oily Press, 1989, Repr. 1992, IX, 307 S. (Oily 

40 Press Lipid Library; 1); "Progress in Lipid Research, Oxford: 

Pergamon Press, 1 (1952) - 16 (1977) u.d.T. : Progress in the Che- 
mistry of Fats and Other Lipids CODEN. 

Zusatzlich zur Messung des Endproduktes der Fermentation ist 
45 es auch moglich, andere Komponenten der Stof fwechselwege zu ana- 
lysieren, die zur Produktion der gewiinschten Verbindung verwendet 
werden, wie Zwischen- und Nebenprodukte , urn die Gesamtef f izienz 
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der Produktion der Verbindung zu bestimmen. Die Analyseverf ahren 
umfassen Messungen der Nahrstof fmengen im Medium (z.B. Zucker, 
Kohlenwasserstof f e, Stickstof f quellen, Phosphat und andere Io- 
nen) , Messungen der Biomassezusammensetzung und des Wachstums, 
5 Analyse der Produktion ublicher Metabolite von Biosynthesewegen 
und Messungen von Gasen, die wahrend der Fermentation erzeugt 
werden. Standardverf ahren fur diese Messungen sind in Applied Mi- 
crobial Physiology; A Practical Approach, P.M. Rhodes und P.F. 
Stanbury, Hrsgb., IRL Press, S. 103-129; 131-163 und 165-192 
10 (ISBN:. 0199635773) und darin angegebenen Literaturstellen be- 
schr ieben . 

Ein Beispiel ist die Analyse von Fettsauren (Abkiirzungen: FAME, 
Fettsauremethylester; GC-MS, Gas-Flussigkeitschromatographie-Mas- 
15 senspektrometrie; TAG, Triacylglycerin; TLC, Dunnschichtchromato- 
graphie) . 

Der unzweideutige Nachweis f Or das Vorliegen von FettsS.ureproduk- 
ten kann mittels Analyse rekombinanter Organismen nach Standard- 
20 Analyseverf ahren erhalten werden: GC, GC-MS oder TLC, wie ver- 
schiedentlich beschrieben von Christie und den Literaturstellen 
darin (1997, in: Advances on Lipid Methodology, Vierte Auf 1 . : 
Christie, Oily Press, Dundee, 119-169; 1998, Gas chroma tographie - 
Massenspektrometrie-Verfahren, Lipide 33:343-353). 

25 

Das zu analysierende Material kann durch Ultraschallbehandlung, 
Mahlen in der Glasmuhle, fltissigen Stickstoff und Mahlen oder 
liber andere anwendbare Verf ahren aufgebrochen werden. Das Mate- 
rial muss nach dem Aufbrechen zentrifugiert werden. Das Sediment 

30 wird in Aqua dest. resuspendiert , 10 min bei 100°C erhitzt, auf 
Eis abgektthlt und erneut zentrifugiert, gefolgt von Extraktion in 
0,5 M Schwefelsaure in Methanol mit 2 % Dimethoxypropan fiir 1 
Std. bei 90°C, was zu hydrolysierten 01- und Lipidverbindungen 
fahrt, die transmethylierte Lipide ergeben. Diese Fettsauremethy- 

"35 lester werden in Petrolether extrahiert und schlieSlich einer GC- 
Analyse unter Verwendvmg einer Kapillarsaule (Chrompack, WCOT Fu- 
sed Silica, CP-Wax-52 CB, 25 mikrom, 0,32 mm) bei einem Tempera- 
turgradienten zwischen 170°C xind 240°C ftlr 20 min und 5 min bei 
240°C unterworfen. Die Identitat der erhaltenen Fettsauremethyle- 

40 ster muss unter Verwendung von Standards, die aus kommerziellen 
Quellen erhaltlich sind (d.h. Sigma) , definiert werden. 



F\ir die Ol-Analyse der mit den Supressionskonstrukten transfor- 
mierten Arabidopsis Pflanzen wird folgendes Protokoll angewendet: 

45 
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Die Extraktion der Lipide aus Samen wird nach der Methode von 
Bligh & Dyer (1959) Can J Biochem Physiol 37:911 durchgef uhrt . 
Dazu werden 5 mg Arabidopsis Samen in 1,2 ml Qiagen-Microtubes 
(Qiagen, Hilden) auf einer Sartorius (Gottingen) Mikrowaage abge- 
5 wogen. Das Samenmaterial wird mit 500 uL Chlorof orm/Methanol 
(2:1; enthalt Mono-C 17 -glycerin von Sigma als internen Standard) 
in der Ratschmuhle MM300 der Firma Retsch (Haan) homogenisiert 
und 20 min bei RT inkubiert. Nach Zugabe von 500 uL 50 mM Kalium- 
phosphatpuf fer pH 7,5 erfolgt die Phasentrennung. Von der organi- 

10 schen Phase werden 50 \ih abgenommen, mit 1500 uL Chloroform ver- 
diinnt und 5 |1L auf die Kapillaren Chromarods SIII der Firma Ia- 
troscan (SKS, Bechenheim) aufgetragen. Nach Auftrag der Proben 
werden diese fur 15 min in einer Dunns chichtkammer, die gesMttigt 
ist mit 6:2:2 Chloroform: Methanol: Toluol in einem ersten 

15 Schritt aufgetrennt. Nach Ablauf der Zeit werden die Kapillaren 4 
min bei Raumtemperatur getrocknet und dann fiir 22 min in eine 
Dunns chichtkammer, die gesattigt ist mit 7:3 n-Hexan:Dieethyle- 
ther gestellt. Nach einem weiteren Trocknungsschritt fur 4 min 
bei Raumtemperatur werden die Proben in einem Iatroscan MK-5 

20 (SKS, Bechenheim) entsprechend Fraser & Taggart, 1988 J. Chroma- 
togr. 439:404 analysiert. Folgende Parameter wurden fur die Mes- 
sungen eingestellt: Slice width 50 msec, Treshold 20 mV, Noise 
30, Skim ratio 0. Die Quantif izierung der Daten erfolgte anhand 
des internen Standards Mono-C17-glycerin (Sigma) sowie einer er- 

25 stellten Eichkurve mit Tri-C17-glycerin (Sigma) mittels des Pro- 
gramms ChromStar <SKS, Beichenheim) . 

Ftir die quantitative Bestimmung der Olgehalte werden Samen von 
jeweils 10 Pflanzen derselben unabhangigen transgenen Linie ana- 

30 lysiert. Insgesamt wurde der Clgehalt von 30 transgene Linien der 
Tl Generation, 10 transgene Linien mit je 10 Pflanzen der T2 Ge- 
neration und 5 transgene Linien mit je 10 Pflanzen der T3 Linien 
bestimmt. Dabei zeigen die transgenen Pflanzen einen signifikant 
hoheren Slgehalt als entsprechend gleichbehandelte Kontrollpf lan- 

35 zen. 

Beispiel 7: 

Zum Nachweis der Funktionalitat der multiplen RNAi Konstrukte 
40 wurden Gene ausgewahlt, deren Supression einen deutlichen phano- 
logischen Effekt hervorrufen. Ein solches Gen ist zum Beispiel 
Tocl59. Dieses Gen ist essentiell fur die Entwicklung und Funk- 
tionalitat von Chloroplasten in Arabidopsis (Bauer et al. Nature, 
403, 203-207). Ein Ausschalten dieses Gens fiihrt zu chlorophyll- 
45 defizienten Pflanzen, deren Blatt-Erscheinungsbild dann hell-griin 
bis weiss ist. Dieser Albino-Phanotyp ist sehr leicht zu unter- 
scheiden von normalen Pflanzen. 
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Als wei teres visuelles Reprotergen wurde GFP, das grun-f luores- 
zierende Protein aus der Qualle Aequorea victoria eingesetzt. 
Dieses Reportergen ist ein haufig verwendetes Reportergen in 
Pflanzen (siehe z.B. Stewart, Plant Cell Rep 2001 20 (5) : 376-82 ) . 
5 Ausgehend von Arabidopsis thaliana cDNA Oder vom Plasmid pEGFP 
(BD Clontech, Heidelberg, Genbank-Eintrag U476561) wurde liber PCR 
mittels der aufgefuhrten Oligonukleotide erzeugt. Dabei wurde 
folgendes Protokoil eingesetzt: 

10 Zusammensetzung des PCR-Ansatzes (50 JiL) : 

5,00 [IL Template cDNA oder genomische ' DNA (ca. 1 jig) 
5,00 JXL lOx Puffer (Advantage- Polymerase) + 25 mM MgCl 2 
5, 00 flL 2mM dNTP 
15 1,25 HL je Primer (10 pmol/Hl») 

0,50 \Hj Advantage-Polymerase (Clontech) 

PCR-Programm: Anf angsdenaturierung fur 2 min bei 95°C, dann 35 Zy- 
klen mit 45 sec 95°C, 45 sec 55°C und 2 min 72°C. Abschliessende 
20 Extension von 5 min bei 72 °C. 

a) Ausgangsvektor pGEM-Tocl59: Ausgehend von Arabidopsis cDNA 
wurde mit nachf olgendem Oligonukleotid-Primerpaar ein Fragment 
aus Tocl59 (Genbank Acc.-No. T14P8.24) amplif iziert : 

25 

ONP18 (SEQ ID NO: 123): 

5 x — CTCGAGGAATTCATGGACTCAAAGTCGGTTACTCCA 

ONP19 (SEQ ID NO: 124) : 
30 5 1 -GGATCCATAAGCAAGCTTTCTCACTCTCCCCATCTGTGGA 

Das PCR Produkt wurde in den Vektor pGEM-T easy von Promega 
(Mannheim) gem^ss Herstellerangaben kloniert, resultierend in .dem 
pGEM-Tocl59 Vektor und die Sequenz uberpruft. 

35 

b) Ausgangsvektor pGEM-GFP: Ausgehend von dem Plasmid pEGFP (BD 
Clontech, Heidelberg, GenbankAcc . -No . : U476561) wurde mit nach- 
folgendem Oligonukleotid-Primerpaar ein Fragment aus GFP amplifi- 
ziert : 

40 

ONP20 (SEQ ID NO: 125): 5 * -AAGCTTCCAACACTTGTCACTACTTT 
ONP21 (SEQ ID NO: 126): 5 * -GGATCCTTAAAGCTCATCATGTTTGT 

Das PCR Produkt wurde in den Vektor pGEM-T easy von Promega 
45 (Mannheim) gemass Herstellerangaben kloniert, resultierend in dem 
pGEM-GFP Vektor und die Sequenz uberpruft . 
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c) Herstellung des Konstruktes pGEM-159-GFP Der Vektor pGEM-GFP 
wurde mit den Restriktionsenzymen Hindlll und BamHI fur 2 Stunden 
inkubiert. Parallel wurde der Vektor pGEM-Tocl59 mit den gleichen 
Restriktionsenzymen inkubiert, anschliessend dann zusatzlich fur 

5 15 min mit alkalischer Phosphatase behandelt. Die alkalische 
Phosphatase wurde anschliessend durch Erhitzen auf 95 oC fur 10 
min inaktiviert. Die entstandenen DNA-Fragmente aus beiden Ansat- 
zen wurden xiber Agarose-Gelelektrophorese aufgetrennt. Das 558 bp 
Fragment aus pGEM-GFP sowie das 3471 bp Fragment von pGEM-Tocl59 

10 wurden aus dem Gel ausgeschnitten und mit dem „Gelpurif ica- 
tion n -Kit (Qiagen) nach Herstellerangaben auf gereinigt . Beide 
Fragmente wurden fur 2 h bei 16°C ligiert (T4 Ligase, New England 
Biolabs) und anschliessend nach Herstellerangaben in E. coli DH5a 
Zellen (Stratagen) trans formi ert . Positive Klone wurden durch PCR 

15 mit dem Primerpaar OPN1 und 0PN4 identif iziert und anschliessend 
verifiziert durch Sequenzierung. Der erhaltene Vektor wurde mit 
pGEM-159-GFP bezeichnet. 

d) Herstellung des Supr.essionskonstruktes 1: Der Vektor 

20 pGEM-159-GFP wurde einerseits mit den Restriktionsenzymen Xhol 
und BamHI, ein weiterer Ansatz mit BamHI und Sail inkubiert. Der 
zweite Ansatz mit BamHI/ .Sail wurde anschliessend fur weitere 15 
min mit alkalischer Phosphatase inkubiert. Die DNA-Fragmente aus 
beiden Ans&tzen wurden uber Agarose-Gelelektrophorese aufgetrennt 

25 und folgende Fragmente ausgeschnitten: Ansatz BamHI-XhoI das 1091 
bp Fragment; Ansatz BamHI-Sall das 4029 bp Fragment. Beide Frag- 
mente wurden nach Aufreinigung aus dem Agarose-Gel (siehe oben) 
fixr 2 h bei 16 °C mit T4 Ligase inkubiert und anschiiessend in E . 
coli DH5a Zellen (Stratagen) trans formiert . Positive Klone wurden 

30 durch PCR mit dem Primerpaar 0PN1 identif iziert und anschliessend 
verifiziert durch Sequenzierung. Der erhaltene Vektor wurde als 
Supressionskonstrukt 1 bezeichnet. 

e) Herstellung des Supressionskonstruktes 2: Das Supressionskon- 
35 strukt 1 und der Vektor p3300.1 (Andreas Hilbrunner, Dissertation 

ETH Ztirich, 2003) wurden fur 2h Stunden rait dem Restriktionsenzym 
EcoRI inkubiert. Anschliessend wurde der Vektor p3300.1 15 min 
. mit alkalischer Phosphatase behandelt. Beide Ansatze wurden ge- 
mischt und fur 2 h bei 16°C mit T4 Ligase inkubiert. Der Ligati- 
40 onsansatz wurde dann in E. coli DHSoc Zellen (Stratagen) transfor- 
miert. Das entstandene Supressionskonstrukt 2 wurde dann fxir die 
Agrobacterium- und Pflanzentransf ormation eingesetzt. Die Nu- 
kleinsauresequenz kodierend fur Supressionskonstrukt 2 
(p3300.1-Tocl59-GFP-RNAi) ist unter SEQ ID NO: 122 wiedergegeben . 



45 
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Die Trans fonnt ion von Agrobakterien und Pflanzen wurde wie in 
Beispiel 3 bzw. 4 beschrieben durchgefuhrt . Zum Nachweis der 
Funktionalitat des Supressionskonstruktes 2 wurde dieses durch 
die nach Bechtold et al., 1993 (C.R. Acad. Sci. Ser. Ill Sci. 
5 Vie., 316, 1194-1199) beschriebene Bltit en-Trans format ionsraethode 
in Arabidopsis trans formiert. Aus Ausgangsmaterial wurden Arabi- 
dopsis Pflanzen der Variet&t Columbia-0 verwendet, die bereits 
die T-DNA des binaren Vektors pBIN-35S-GFP enthielten. 

10 Durch Anregung durch ultraviolettes Licht im Wellenlangenbereich 
470-490 nm die griine Fluoreszenz von GFP in diesen Pflanzen ange- 
regt werden und damit die Expression des eingebrachten Transgens 
tiberprtift werden. Dazu wurden Keimlinge 1 Woche nach Keimung oder 
Blattstiicke bei alteren Pflanzen mit dem Fluoreszenzmikroskop 

15 MZFLIII von Leica analysiert. Zur Anregung von GFP wurden fol- 
gende Parameter eingestellt: Quecksilberlampe HBO 100W/DC, Filter 
GFP3, Bildbearbeitung Leica-Sof tware'. Speziell die Verwehdung ei- 
nes Filters (GFP3 ) , der oberhalb einer Wellenlange von 525 nm 
nicht mehr durchl&ssig ist, ermoglicht die GFP-Analyse von grunen 

20 Blattmaterial . Ohne diesen Filter konnte die starke Autofluores- 
zenz des Blattf arbstof f es Chlorophyll nicht ausgeschlossen wer- 
den. Die zur Transformation verwendete Arabidopsis Linie zeigte 
eine starke GFP Expression nach mikroskopischer Analyse. 

25 Transf ormierte Samen wurden direkt auf Erde ausgelegt und angezo- 
gen. Nach einer Woche wurde nach Keimlingen gesucht, die keinen 
oder einen reduzierten Anteil des Blattf arbstof fes Chlorophyll 
enthielten. Seiche Pflanzen waren leicht an ihrer hellgrQnen oder 
weisen Erscheinungsbild zu erkennen. Diese Pflanzen wurden dann 

30 weiter durch Fluoreszenz-Mikroskopie untersucht und mit entspre- 
chend parallel gewachsenen griinen Pflanzen verglichen. Fig.SA 
zeigt beispielhaft ein solche identif izierte Pflanze, die sich 
deutlich in der Farbe der Blatter von parallel gewachsenen Pflan- 
zen unterscheidet . Dabei ist der Albino-Ph&iotyp (weisse Blatter) 

35 auf die Wirkung des Tocl59-Supressionskonstrukts zuruckzuf iihr en . 
Die nicht trans formierten Nachkomraen der mit Agrobacerium-Suspen- 
sion behandelten Pflanzen zeigen den Albino-Phanotyp nicht. Der 
auftretende Albino-Phanotyp ist damit ein spezifischer Effekt des 
eingebrachten Supressionskonstruktes . 

40 

Die Fluoreszenz-mikroskopische Untersuchung der Albino -Pflanzen 
zeigte dann (Fig.SB), dass keine GFP-Signale in solchen Pflanzen 
gefunden werden konnte. Im Vergleich dazu zeigten die parallel 
gewachsenen griinen Pflanzen deutliche GFP Signale. Die Abwesen- 
45 heit des GFP-Signals in alien identif izierten Albino-Pf lanzen de- 
monstriert die Funktionalitat des Supressionskonstruktes, denn 
nur die mit dem Supressionkonstrukt transf ormiert en Pflanzen 
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zeigten keine GFP-Signale mehr. Es konnte keine Segregation der 
beiden angestrebten Phanotypen beobachtet werden. Damit konnte 
gezeigt werden, dass durch Verwendung von nur einem Kontrollele- 
ment (Promotor) zwei funktionell vollig unterschiedliche Gene, 
5 die ihrerseits durch unterschiedliche Kontrollelemente in ihrer 
Expression reguliert werden, ausgeschaltet werden konnten. 
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•PatentansprQche 

1. Verfahren zur Verminderung der Expression von mindestens zwei 
5 verschiedenen, endogenen Zielgenen in einer eukaryotischen 

Zelle Oder einem eukaryotische Organismus durch Einbringen 
eines zumindest teilweise doppelstrangigen Ribonukleinsaure- 
molekiils in besagte eukaryotische Zelle oder besagten euka- 
ryotischen Organismus, wobei das doppelstrangige Ribonuklein- 
10 sauremolekiil umfasst 

a) mindestens zwei *sense"-Ribonukleotidsequenzen, wobei je- 
weils mindestens eine dieser w sense"-Ribonukleotidsequen- 
zen im wesentlichen identisch ist zu mindestens einem 

15 Teil des W sense"-RNA-Transkriptes eines jeden der besag- 

ten endogenen Zielgene und 

b) u antiserise"-Ribonukleotidsequenzen, die zu besagten 
w sense"-Ribonukleotidsequenzen unter a) im wesentlichen 

20 komplementaren sind. 

2. Verfahren nach Anspruch 1, wobei die transkribierten RNAs von 
mindestens zwei der in ihrer Expression verminderten Zielgene 
untereinander eine Homologie von unter 90% haben. 

25 

3. Verfahren nach Anspruch 1 oder 2, wobei die doppelstrangige 
RNA durch ein einziges selbstkomplementares Ribonukleotidmo- 
lekul gebildet wird. 

30 4. Verfahren nach einem der Ansprftche 1 bis 3, wobei mindestens 
eine der ausgehend von den einzelnen "sense" -Ribonukleotidse- 
quenzen gebildeten doppelstrangigen RNA-Strukturen eine Lange 
eines geradzahligen Vielfachen von 21 oder 22 Basenpaaren 
hat. 

35 

5. Verfahren nach einem der Anspruche 1 bis 4, wobei das Ribonu- 
kleotidmolektil zwischen mindestens einer " sense "-Ribonukleo- 
tidsequenz und der dazu im wesentlichen komplementaren "anti- 
sense "-Ribonukleotidsequenz eine Ribonukleotidsequenz kodie- 
40 rend ftlr ein Intron enthalt. 



45 
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6. Verfahren nach einera der Anspriiche 1 bis 5, dadurch gekenn- 
zeichnet, dass mindestens zwei der endogenen Zielgene ausge- 
wahlt sind aus jeweils unterschiedlichen Klassen von Spei- 
cherprotein ausgewahlt aus den Speicherprotein-Klassen der 
5 2S-Albumine, 7S-Globuline, HS/12S~Globuline Oder 2ein~ Prola- 

mine . 



7. Verfahren nach einem der Anspruche 1 bis 6, wobei mindestens 
eine w sense "-Ribonukleotidsequenz im wesentlichen identisch 
10 ist zu mindestens einem Teil des tt sense "-RNA-Transkriptes 

a) einer Speicherprotein-Nukleinsauresequenz gemaS SEQ ID 
NO: 1, 3, 5, 7, 9, 11, 13, 15 , 17, 19, 21, 23, 25, 27, 
29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 59, 61, 

15 63, 65, 67, 69, 71, 93, 95, 97, 99, 101, 103, 105, 107, 

109 oder 112, oder 

b) eines Gens aus dem Homogentisatabbauweg gemafc SEQ ID NO: 
115, 116, 118 oder 120, oder 

20 

c) eines Gens ausgewahlt aus der Gruppe bestehend aus Ace- 
tyl transacylasen, Acyltransportproteinen, Fettsauredesa- 
turasen, Malonyl transacylasen, p-Ketoacyl-ACP-syntheta- 
sen, 3-Keto-ACP-reduktasen, Enoyl-ACP-hydrasen, Thioeste- 

25 rasen, Enoyl-ACP-reduktasen, ADP-Glucosepyrophosphoryla- 

sen, Phosphorylasen, Starkesynthetasen, Q-Enzymen, Su- 
crose-6-phosphatsynthetasen, Sucrose-6-phosphatphosphata- 
sen , ADP-Glucos epyrophosphorylasen , Br anching-Enz ymen , 
Debranching-Enzymen, Amylasen, Chalconsynthasen, Chalco- 

30 nisomerasen, Phenylalaninairanonialyasen, Dehydrokaempf e- 

rol (flavone)hydroxylasen, Dihydrof lavonolreduktasen, Di- 
hydrof lavanol-2-hydroxylasen, Flavonoid-3 ' -hydroxylases 
Flavonoid-5 ' -hydroxylases Flavonoidglycosyl trans f erasen, 
Flavonoidmethyltransferasen, Flavonoidacyltransf erasen, 

35 Polygalacturonase^ Cellulasen, Pectinesterasen, 

p-(l-4)Glucanasen, P-Galactanasen, 1-Aminocyclopro- 
pan-l-carboxylatsynthasen , Phytoendesaturasen , Cinnamoyl- 
CoA :NADPH-Reduktasen , Cinnamoylalkoholdehydrogenasen , 
Cof feinsSure-O-methyltransferasenn Cinnamoylalkoholdehy- 

40 drogenasen, Polyphenoloxidasen, Homogentisat-1 , 2 -di oxyge- 

nases Maleylacetoacetatisomerasen, Fumarylacetoacetathy- 
drolasen, N-Methyl-putrescinoxidasen, Putrescin-N-methyl- 
transf erasen, 7 -Methylxanthine-3 -methyl trans f erasen, 
l-Methylxanthin-3 -methyl trans f erasen und Threoninsyntha- 

45 sen. 
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8. Ribonukleinsauremolekul, das eine zumindest teilweise doppel- 
strangige Struktur hat und umfasst 

a) mindest.ens zwei n sense " -Ribonukleot ids equenzen, wobei je- 
5 weils mindestens eine dieser 

w sense" -Ribonukleotidsequenzen im wesent lichen identisch 
ist zu mindestens einem Teil des *sense"-RNA-Transkriptes 
eines endogenen Zielgens, wobei jedoch nicht alle 
n sense"-Ribonukleotidsequenzen zu dem n s ens e ' -KNA-Tr ans - 
10 kript eines einzigen endogenen Zielgens im wesentlichen 

identisch sind, und 

b) w antisense"-Ribonukleotidsequenzen, die zu besagten 

* sense" -Ribonukleotidsequenzen unter a) im wesentlichen 
15 komplementaren sind. 

9. Ribonukleinsauremolekul nach Anspruch 8, wobei das Ribonu- 
kleinsauremolekiil wie in einem der Anspruche 2 bis 7 gekenn- 
zeichnet ist. 

20 

10. Transgene Expressionskassette enthaltend in funktioneller 
Verkniipfung mit einem Promotor eine Nukleinsauresequenz 
kodierend fur doppelstr&ngiges RibonukleinsSuremolekul gemafi 
einem der Anspruche 8 oder 9, wobei das RibonukleinsSuremole- 

25 kul aus einem einzigen RNA-Strang gebildet wird. 

11. Transgenes Express ions system enthaltend 

a) in funktioneller Verkntipfung mit einem Promotor eine 

30 Nukleinsauresequenz kodierend fur n sense "-Ribonukleotid- 

sequenzen eines doppelstrangigen Ribonukleinsauremolekuls 
gem££ einem der Anspruche 8 oder 9 und 

b) in funktioneller Verkntipfung mit einem Promotor eine 

35 Nukleinsauresequenz kodierend fur w antisense"-Ribonukleo- 

tidsequenzen eines doppelstrSngigen Ribonukleinsauremole- 
kuls gemafi einem der Anspruche 8 oder 9, 

wobei das Ribonukleinsauremolekul aus den beiden unter a) 
40 und b) definierten StrSmgen gebildet wird, und die Promotoren 

so gewahlt sind, das in einem bestimmten Organismus oder 
Zelle die .gleichzeitige Expression von n sense "-Ribonukleotid- 
sequenzen und tt antisense"-Ribonukleotidsequenzen gewahrlei- 
stet ist. 

45 
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12. Transgener Vektor enthaltend eine transgene Expressions- 

kassette gemafi Anspruch 10 oder ein transgenes Expressions- 
system gem&£ Anspruch 11. 

5 13. Transgener Organismus enthaltend eine transgene Expressions- 
kassette gema£ Anspruch 10 oder ein transgenes Expressions- 
system gemSE Anspruch 11 oder einen transgenen Vektor gemaE 
Anspruch 12 . 

10 14. Transgener Organismus nach Anspruch 13 ausgewShlt aus der 
Gruppe bestehend aus Bakterien, Hefen, nicht-menschlichen 
Tieren und Pflanzen. 

15 ; Transgener Organismus nach Anspruche 13 , dadurch gekenn- 
15 zeichnet, dass die Pflanze ausgewahlt ist aus der Gruppe der 

landwirtschaft lichen Nutzpf lanzen. 

16. Verwendung eines Ribonukleotidmolekuls nach einem der Anspru- 
che 8 oder 9, einer transgenen Expressionskassette gemafe An- 
20 spruch 10, eines transgenen Express ions system gemafc Anspruch 



11, eines transgenen Vektors gem&£ Anspruch 12 oder eines 
transgenen Organismus gemafi einem der Anspruche 13 bis 15 zur 
Herstellung von Arzneimitteln, in biotechnologischen Verfah- 
ren oder in der Pf lanzenbiotechnologie . 



25 

17. Verwendung nach Anspruch 16, wobei mindestens einer der nach- 
folgenden Eigenschaf ten in Pflanzen erzielt wird: 



b) Modification der Zusammensetzung und/oder des Gehaltes an 
Fettsauren, Lipiden oder Qlen 

c) • Modification der Kohlenhydratzusammensetzung 



a) 



Verbesserter Schutz gegen abiotische Stressf aktoren 



30 



35 



d) 



Veranderung der Farbe oder Pigmentierung 



e) 



Verminderung des Gehaltes von Speicherproteinen 



40 



f) 



Erreichen einer Resistenz gegen pf lanzliche Pathogene 



g) 



Verhinderung von Halmbruch 



h) 



Verzogerung der Fruchtreifung 



i) 



Erzielen einer mannlichen Sterilitat 



15 
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j) Verminderung unerwunschter oder toxischer Pflanzenin- 
haltsstoff e 

k) Verzogerung von Alterserscheinungen • 

5 

1) Modifikation der Lignif ikation und/oder des Ligningehal- 
tes 

m) Modifikation des Faseranteils in Nahrungsmitteln oder der 
10 Faserqualitat in Baumwolle 

n) Venninderung der Stofcanfalligkeit 

o) Steigerung der Vitamin E Biosynthese 

p) Verminderung des Nikotingehaltes, des Cof f eingehaltes 
oder des Theophyllin-Gehaltes 



q) Erhdhung des Methioningehaltes durch Verminderung der' 
20 Threoninbiosynthese 



25 



30 



35 



40 



45 
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SEQUENZ PROTOKOLL 

<110> BASF Plant Science GmbH 

<120> Konstrukte und Verfahren zur Regulation der 
Genexpression 

<130> PD009300062-AT 

<140> 
<141> 

<160> 126 

<170> Patentln Ver. 2.1 

<210> 1 
<211> 495 
<212> DNA 

<213> Arabidopsis thaliana 

<220> 

<221> CDS 

<222> (1)..(492) 

<223> albumine' 2S subunit 1 

<400> 1 

atg gca aac aag ttg ttc etc gtc tgc gca get etc get etc tgc ttc . 48 

Met Ala Asn Lys Leu Phe Leu Val Cys Ala Ala Leu Ala Leu Cys Phe 
15 10 15 

etc etc acc aac get tec ate tac cgc acc gtc gtt gag ttc gaa gaa 96 
Leu Leu Thr Asn Ala Ser lie Tyr Arg Thr Val Val Glu Phe Glu Glu 
* 20 25 30 

gat gac gee act aac ccc ata ggc cca aaa atg agg aaa tgc cgc aag 144 
Asp Asp Ala Thr Asn Pro lie Gly Pro Lys Met Arg Lys Cys Arg Lys 
35 40 45 

gag ttt cag aaa gaa caa cac eta aga get tgc cag caa ttg atg etc 192 
Glu Phe Gin Lys Glu Gin His Leu Arg Ala Cys Gin Gin Leu Met Leu 
50 55 .60 

cag caa gca agg caa ggc cgt age gat gag ttt gat ttc gaa gac gac 240 
Gin Glri Ala Arg Gin Gly Arg Ser Asp Glu Phe Asp Phe Glu Asp Asp 
65 70 75 ^ 80 

atg gag aac cca cag gga caa cag cag gaa caa cag eta ttc cag cag 288 
Met Glu Asn Pro Gin Gly Gin Gin Gin Glu Gin Gin Leu Phe Gin Gin 
85 9-0 95 

tgc tgc aac gag ctt cgc cag gaa gag cca gat tgt gtt tgc ccc acc 336 
Cys Cys Asn Glu Leu Arg Gin Glu Glu Pro Asp Cys Val Cys Pro Thr 
100 105 110 

ttg aaa caa get gee aag gee gtt aga etc cag gga cag cac caa cca 384 
Leu Lys Gin Ala Ala Lys Ala Val Arg Leu Gin Gly Gin His Gin Pro 
115 120 125 

atg caa gtc agg aaa att tac cag aca gee aag cac ttg ccc aac gtt 432 
Met Gin Val Arg Lys He Tyr Gin Thr Ala Lys His Leu Pro Asn Val 
130 135 140, 

tgc gac ate ccg caa gtt gat gtt tgt ccc ttc aac ate cct tea ttc 480 
Cys Asp He Pro Gin Val Asp Val Cys Pro Phe Asn He Pro Ser Phe 
145 150 155 160 

cct tct ttc tac taa 495 
Pro Ser Phe Tyr 
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<210> 2 
<211> 164 
<212> PRT 

<213> Arabidopsis thaliana 
<400> 2 

Met Ala Asn Lys Leu Phe Leu Val Cys Ala Ala Leu Ala Leu Cys Phe 
1.5 10 15 

Leu Leu Thr Asn Ala Ser lie Tyr Arg Thr Val Val Glu Phe Glu Glu 
20 25 30 

Asp Asp Ala Thr Asn Pro lie Gly Pro Lys Met Arg Lys Cys Arg Lys 
35 40 45 

Glu Phe Gin Lys Glu Gin His Leu Arg Ala Cys Gin Gin Leu Met Leu 
50 55 60 

Gin Gin Ala Arg Gin Gly Arg Ser Asp Glu Phe Asp Phe Glu Asp Asp 
65 .70 75 80 

Met Glu Asn Pro Gin Gly Gin Gin Gin Glu Gin Gin Leu Phe Gin Gin 
85 90 95 

Cys Cys Asn Glu Leu Arg Gin Glu Glu Pro Asp Cys Val Cys Pro Thr 
100 105 • 110 

Leu Lys Gin Ala Ala Lys Ala Val Arg Leu Gin Gly Gin His Gin Pro 
115 120 125 

Met Gin Val Arg Lys lie Tyr Gin Thr Ala Lys His Leu Pro Asn Val 
130 135 140 

Cys Asp He Pro Gin Val Asp Val Cys Pro Phe Asn He Pro Ser Phe 
145 150 155 160 

Pro Ser Phe Tyr 



<210> 3 
<211> 495 
<212> DNA 

<213> Arabidopsis thaliana 

<220> 

<221> CDS 

<222> (1)..(492) 

<223> albumine 2S subunit 3 

<400> 3 

atg get aac aag etc ttc etc gtc tgc gca act etc gec etc tgc ttc 48 

Met Ala Asn Lys Leu Phe Leu Val Cys Ala Thr Leu Ala Leu Cys Phe 

15 10 15 

etc etc ace aac get tec ate tac cgc acc gtt gtc gaa ttc gaa gaa 96 
Leu Leu Thr Asn Ala Ser He Tyr Arg Thr Val Val Glu Phe Glu Glu 
20 25 30 . 

gat gac gec age aac ccc gta ggt cca aga cag aga tgc cag aag gag 144 
Asp Asp Ala Ser Asn Pro Val Gly Pro Arg Gin Arg Cys Gin Lys Glu 
35 40 45 

ttt cag caa tea caa cac eta aga get tgc cag aga tgg atg age aag 192 
Phe Gin Gin Ser Gin His Leu Arg Ala Cys Gin Arg Trp Met Ser Lys 
50 55 60 
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caa atg agg caa gga cgt ggt ggt ggt cct tec etc gac gat gag ttc 240 
Gin Met Arg Gin Gly Arg Gly Gly Gly Pro Ser Leu Asp Asp Glu Phe 
65 70 75 ~ 80 

gat ttc gag ggc ccc cag cag gga tac cag eta etc cag cag tgc tgc 288 
Asp Phe Glu Gly Pro Gin Gin Gly Tyr Gin Leu Leu Gin Gin Cys Cys 
' 85 90 95 

aac gag ctt cgc cag gaa gag cca gtt tgc gtt tgc ccc ace ttg aaa 336 
Asn Glu Leu Arg Gin Glu Glu Pro Val Cys Val Cys Pro.Thr Leu Lys 
100 105 110 

caa get gee agg gca gtt age etc cag gga cag cac gga cca ttc caa 384 
Gin Ala Ala Arg Ala Val Ser Leu Gin Gly Gin His Gly Pro Phe Gin 
115 120 125 

tec agg aaa att tac cag tea get aag tac ttg cct aac att tgc aag 432 
Ser Arg Lys He Tyr Gin Ser Ala Lys Tyr Leu Pro Asn He Cys Lys 
130 135 140 

ate cag caa gtt ggt gaa tgt ccc ttc cag acc ace ate cct ttc ttc 480 

He Gin Gin Val Gly Glu Cys Pro Phe Gin Thr Thr He Pro Phe Phe 

145 150 15.5 160 

cct cct tac tac tag 495 

Pro Pro Tyr Tyr 

<210> 4 
<211> 164 
<212> PRT 

<213> Arabidopsis thaliana 
<400> 4 

Met Ala Asn Lys Leu Phe Leu Val Cys Ala Thr Leu Ala Leu Cys Phe 
1 5 10 15 

Leu Leu Thr Asn Ala Ser He Tyr Arg Thr Val Val Glu Phe Glu Glu 
20 25 30 

Asp Asp Ala Ser Asn Pro Val Gly Pro Arg Gin Arg Cys Gin Lys Glu 
35 40 45 

Phe Gin Gin Ser Gin His Leu Arg Ala Cys Gin Arg Trp Met Ser Lys 
50 55 60 

Gin Met Arg Gin Gly Arg Gly Gly Gly Pro Ser Leu Asp Asp Glu Phe 
65 70 75 80 

Asp Phe Glu Gly Pro Gin Gin Gly Tyr Gin Leu Leu Gin Gin Cys Cys 
85 90 95 

Asn Glu Leu Arg Gin Glu Glu Pro Val Cys Val Cys Pro Thr Leu Lys 
100 105 no 

Gin Ala Ala Arg Ala Val Ser Leu Gin Gly Gin His Gly Pro Phe Gin 
115 120 125 

Ser Arg Lys He Tyr Gin Ser Ala Lys Tyr Leu Pro Asn He Cys Lys 
130 135 140 

He Gin Gin Val Gly Glu Cys Pro Phe Gin Thr Thr He Pro Phe Phe 
145 150 155 160 

Pro Pro Tyr Tyr 



<210> 5 
<211> 513 
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<212> DNA 

<213> Arabidopsis thaliana 

<220> 

<221> CDS 

<222> (1) . . (510) 

<223> albumine 2S subunit 2 

<400> 5 

atg gca aac aag etc ttc etc gtc tgc gca act ttc gec etc tgc ttc 48 

Met Ala Asn Lys Leu Phe Leu Val Cys Ala Thr Phe Ala Leu Cys Phe 
1 5 10 15 

etc etc acc aac get tec ate tac cgc act gtt gtc gag ttc gac gaa 96 
Leu Leu Thr Asn Ala Ser lie Tyr Arg Thr Val Val Glu Phe Asp Glu 
20 25 30 

gat gac gee age aac ccc atg ggc cca aga cag aaa tgt cag aag gag 144 
Asp Asp Ala Ser Asn Pro Met Gly Pro Arg Gin Lys Cys Gin Lys Glu 
35 40 45 

ttt cag caa tea cag cac eta aga get tgc cag aaa ttg atg cgc atg 192 
Phe Gin Gin Ser Gin His Leu Arg Ala Cys Gin Lys Leu Met Arg Met 
50 55 60 

caa atg agg caa ggc cgt ggt ggt ggt ccc tec etc gac gat gag ttc 240 
Gin Met Arg Gin Gly Arg Gly Gly Gly Pro Ser Leu Asp Asp Glu Phe 
65" 70 75 80 

gat ttg gaa gac gac ate gag aac cca caa ggc ccc cag cag gga cac 2 88 
Asp Leu Glu Asp Asp lie Glu Asn Pro Gin Gly Pro Gin Gin Gly His 
85 90 95 

cag ate etc cag cag tgc tgc age . gag ctt cgc cag gaa gag cca gtt 336 
Gin lie Leu Gin Gin Cys Cys Ser Glu Leu Arg Gin Glu Glu Pro Val 
100 105 110 

tgt gtt tgc ccc acc ttg aga caa get gec agg gee gtt age etc cag 384 
Cys Val Cys Pro Thr Leu Arg Gin Ala Ala Arg Ala Val Ser Leu Gin 
115 120 125 

gga caa cac gga cca ttc caa tec agg aaa att tac aag aca get aag 432 
Gly Gin His Gly Pro Phe Gin Ser Arg Lys lie Tyr Lys Thr Ala Lys 
130 135 140 

tac ttg cct aac att tgc aag ate cag caa gtt ggt gaa tgc ccc ttc 480 
Tyr Leu Pro Asn lie Cys Lys lie Gin Gin Val Gly Glu Cys Pro Phe 
145 150 155 • 160 

cag acc acc ate cct ttc ttc cct cct tac taa 513 
Gin Thr Thr lie Pro Phe Phe Pro Pro Tyr 
165 170 

<210> 6 
<211> 170 
<212> PRT 

<213> Arabidopsis thaliana 
<400> 6 

Met Ala Asn Lys Leu Phe Leu Val Cys Ala Thr Phe Ala Leu Cys Phe 
15 10 15 

Leu Leu Thr Asn Ala Ser lie Tyr Arg Thr Val Val Glu Phe Asp Glu 
20 .25 30 



Asp Asp Ala Ser Asn Pro Met 
35 



Gly Pro Arg Gin Lys 
40 



Cys Gin Lys 
45 



Glu 
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Phe Gin Gin Ser Gin His Leu Arg Ala Cys Gin Lys Leu Met Arg Met 
50 55 60 

Gin Met Arg Gin Gly Arg Gly Gly Gly Pro Ser Leu Asp Asp Glu Phe 
65 70 75 4 80 

Asp Leu Glu Asp Asp lie Glu Asn Pro Gin Gly Pro Gin Gin Gly His 
85 90 95 

Gin lie Leu Gin Gin Cys Cys Ser Glu Leu Arg Gin Glu Glu Pro Val 
100 105 no 

Cys Val Cys Pro Thr Leu Arg Gin Ala Ala Arg Ala Val Ser Leu Gin 
115 120 - 125 

Gly Gin His Gly Pro' Phe Gin Ser Arg Lys He Tyr Lys Thr Ala Lys 
130 135 140 

Tyr Leu Pro Asn He Cys Lys He Gin Gin Val Gly Glu Cys Pro Phe 
145 150 155 " 160 

Gin Thr Thr He Pro Phe Phe Pro Pro Tyr 
165 170 



<210> 7 
<211> 501 
<212> DNA 

<213> Arabidopsis thaliana 

<220> 

<221> CDS 

<222> (1)..{498) 

<223> albumine 2S subunit 4 

<400> 7 

atg gcg aac aag etc ttc etc gtc tgc gca get etc gee ctg tgt ttc 48 
Met Ala Asn Lys Leu Phe Leu Val Cys Ala Ala Leu Ala Leu Cys Phe 
15 10 15 

ate etc ace aac get tec gtc tat cgc acc gtt gtc gag ttc gac gaa 96 
He Leu Thr Asn Ala Ser Val Tyr Arg Thr Val Val Glu Phe Asp Glu 
20 25 30 

gat gac gec agt aac ccc ata gge'eca ata cag aaa tgt cag aag gag 144 
Asp Asp Ala Ser Asn Pro He Gly Pro He Gin Lys Cys Gin Lys Glu 
35 .40 45 

ttt cag caa gac cag cac eta aga get tgc cag aga tgg atg cgc aag 192 
Phe Gin Gin Asp Gin His Leu Arg Ala Cys Gin Arg Trp Met Arg Lys 
50 55 60 

caa atg tgg caa gga cgt ggt ggt ggt cct tec etc gac gat gag ttc 240 
Gin Met Trp Gin Gly Arg Gly Gly Gly Pro Ser Leu Asp Asp Glu Phe 
65 70 75 ~ 80 

gat atg gaa gac gac ate gag aac ccg cag. aga cga cag eta etc cag 288 
Asp Met Glu Asp Asp He Glu Asn Pro Gin Arg Arg Gin Leu Leu Gin 
85 ■ ' 90 95 

•aag tgc tgc age gag ctt cgc caa gaa gag cca gtt , tgc gtt tgc ccc 336 
Lys Cys Cys Ser Glu Leu Arg Gin Glu Glu Pro Val Cys Val Cys Pro 
100 105 HO 

acc ttg aga caa get gee aag gee gtt aga ttc cag gga cag caa cac 384 
Thr Leu Arg Gin Ala Ala Lys Ala Val Arg Phe Gin Gly Gin Gin His 
115 120 125 



501 
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caa cca gag caa gtc agg aaa att tac cag gca get aag tac ttg cct 432 
Gin Pro Glu Gin Val Arg Lys lie Tyr Gin Ala Ala Lys Tyr Leu Pro 
130 135 140 

aac att tgc aaa ate cag caa gtt ggt gtt tgc ccc ttc cag ate cct 480 
Asn lie Cys Lys lie Gin Gin Val Gly Val Cys Pro Phe Gin lie Pro 
145 150 155 160 

tea ate cct tct tac tac taa 
Ser lie Pro Ser Tyr Tyr 
165 

<210> 8 
<211> 166 
<212> PRT 

<213> Arabidopsis thaliana 
<400> 8 

Met Ala Asn Lys Leu Phe Leu Val Cys Ala Ala Leu Ala Leu Cys Phe 
15 io 15 

lie Leu Thr Asn Ala Ser Val Tyr Arg Thr Val Val Glu Phe Asp Glu 
20 25 30 

Asp Asp Ala Ser Asn Pro He Gly Pro He Gin Lys Cys Gin Lys Glu 
35 40 45 

Phe Gin Gin Asp Gin His Leu Arg Ala Cys Gin Arg Trp Met Arg Lys 
50 55 60 

Gin Met Trp Gin Gly Arg Gly Gly Gly Pro Ser Leu Asp Asp Glu Phe 
65 70 75 80 

Asp Met Glu Asp Asp He Glu Asn Pro Gin Arg Arg Gin Leu Leu Gin 
85 90 95 

Lys Cys Cys Ser Glu Leu Arg Gin Glu Glu Pro Val Cys Val Cys Pro 
100 105 HO 

Thr Leu Arg Gin Ala Ala Lys Ala Val Arg Phe Gin Gly Gin Gin His 
115 120 125 

Gin Pro Glu Gin Val Arg Lys He Tyr Gin Ala Ala Lys Tyr Leu Pro 
130 135 140 

Asn He Cys Lys He Gin Gin Val Gly Val Cys Pro Phe Gin He Pro 
145 150 155 160 

Ser He Pro Ser Tyr Tyr 
165 



<210> 9 
<211> 1473 
<212> DNA 

<213> Brass ica napus 

<220> 
<221> CDS 
\<222> (1)..(1470) 
<223> cruciferin 

<400> 9 

atg get egg etc tea tct ctt etc tct ttt tec tta gca ctt ttg ate 48 

Met Ala Arg Leu Ser Ser Leu Leu Ser Phe Ser Leu 1 Ala Leu Leu He 

1 5 10 15 
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ttt etc cat ggc tct aca get caa cag ttt cca aac gag tgt cag eta 96 
Phe Leu His Gly Ser Thr Ala Gin Gin Phe Pro Asn Glu Cys Gin Leu 
20 25. 30 

gac cag etc aat gca ctg gag ccg tea cac gta ctt aag get gag get 144 
Asp Gin Leu Asn Ala Leu Glu Pro Ser His Val Leu Lys Ala Glu Ala 
35 40 45 

ggt cgc ate gag gtg tgg gac cac cac get cct cag eta cgt tgc tct 192 
Gly Arg lie Glu Val Trp Asp His His Ala Pro Gin Leu Arg Cys Ser 
50 55 60 

ggt gtc tec ttt gta cgt tac ate ate gag tct aag ggt etc tac ttg 240 
Gly Val Ser Phe Val Arg Tyr lie lie Glu Ser Lys Gly Leu Tyr Leu 
65 70 ' 75 80 

ccc tct ttc ttt age acc gcg aag etc tec ttc gtg get aaa gga gaa 288 
Pro Ser Phe Phe Ser Thr Ala Lys Leu Ser Phe Val Ala Lys Gly Glu 
• 85 90 95 

ggt ctt atg ggg aga gtg gtc cct gga tgc gee gag aca ttc cag gac 336 
Gly Leu Met Gly Arg Val Val Pro Gly Cys Ala Glu Thr Phe Gin Asp 
100 105 110 

tea tea gtg ttt caa cca age ggt ggt age ccc teg gga gaa ggt cag 384 
Ser Ser Val Phe Gin Pro Ser Gly Gly Ser Pro Ser Gly Glu Gly Gin 
115 120 125 

ggc caa gga caa caa ggt cag ggc caa ggc cac caa ggt caa ggc caa 432 
Gly Gin Gly Gin Gin Gly Gin Gly Gin Gly His Gin Gly Gin Gly Gin 
130 135 ■ 140 

gga caa cag ggc caa caa ggt cag caa gga caa cag agt caa ggc cag 480 
Gly Gin Gin Gly Gin Gin Gly Gin Gin Gly Gin Gin Ser Gin Gly Gin 
145 150 155 160 

ggc ttc cgt gat atg cac cag aaa gtg gag cac ata agg act ggg gac 528 
Gly Phe Arg Asp Met His Gin Lys Val Glu His lie Arg Thr Gly Asp 
165 170 175 

acc ate get aca cat ccc ggt gta gee caa tgg ttc tac aac gac gga 576 
Thr lie Ala Thr His Pro Gly Val Ala Gin Trp Phe Tyr Asn Asp Gly 
180 185 190 

aac caa cca ctt gtc ate gtt tec gtc etc gat tta gec age cac cag 624 
Asn Gin Pro Leu Val lie Val Ser Val Leu Asp Leu Ala Ser His Gin 
195 200 205 

aat cag etc gac cgc aac cca agg cca ttt tac tta gee gga aac aac 672 
Asn Gin Leu Asp Arg Asn Pro Arg Pro Phe Tyr Leu Ala Gly Asn Asn 
210 215 220 

cca caa ggc caa gta tgg ata gaa gga cgc gag caa cag cca caa. aag 720 
Pro Gin Gly Gin Val Trp He Glu Gly Arg Glu Gin Gin Pro Gin Lys 
225 230 235 240 

aac ate ctt aat ggc ttc aca cca gag gtt ctt get aaa get ttc aag 768 
Asn He Leu Asn Gly Phe Thr Pro Glu Val Leu Ala Lys Ala Phe Lys 
245 250 255 

ate gat gtt agg aca gcg caa caa ctt cag aac cag caa gac aac cgt 816 
He Asp Val Arg Thr Ala Gin Gin Leu Gin Asn Gin Gin Asp Asn Arg 
260 265 270 

gga aac att ate cga gtc caa ggc cca ttc agt gtc att agg ccg cct 864 
Gly Asn He He Arg Val Gin Gly Pro Phe Ser Val He Arg Pro Pro 
275 280 285 
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ttg agg agt cag aga ccg cag gag aca gaa gtt aac ggt tta gaa gag 912 
Leu Arg Ser Gin Arg Pro Gin Glu Thr Glu Val Asn Gly Leu Glu Glu 
290 295 300 

acc ata tgc age gcg agg tgc acc gat aac etc gat gac cca tct aat 960 
Thr lie Cys Ser Ala Arg Cys Thr Asp Asn Leu Asp Asp Pro Ser Asn 
305 310 315 320 

get gac gta tac aag cca cag etc ggt tac ate age act ctg aac age 1008 
Ala Asp Val Tyr Lys Pro Gin Leu Gly Tyr lie Ser Thr Leu Asn Ser 
325 330 335 

tat gat etc ccc ate ctt cgc ttc ctt cgt etc tea gee etc cgt gga 1056 
.Tyr Asp Leu Pro lie Leu Arg Phe Leu Arg Leu Ser Ala Leu Arg Gly 
340 345 350 

tct ate cgt caa aac gcg atg gtg ctt cca cag tgg aac gca aac gca 1104 
Ser lie Arg Gin Asn Ala Met Val Leu Pro Gin Trp Asn Ala Asn Ala 
355 360 365 

aac gcg gtt etc tac gtg aca gac ggg gaa gee cat gtg cag gtg gtt 1152 
Asn Ala Val Leu Tyr Val Thr Asp Gly Glu Ala His Val Gin Val Val' 
370 375 380 

aac gac aac ggt gac aga gtg ttc gac gga caa gtc tct caa gga cag 1200 
Asn Asp Asn Gly Asp Arg Val Phe Asp Gly Gin Val Ser Gin Gly Gin 
385 390 395 400 

eta ctt tec ata cca caa ggt ttc tec gtg gtg aaa cgc gca aca age 1248 
Leu Leu Ser lie Pro Gin Gly Phe Ser Val Val Lys Arg Ala Thr Ser 
405 410 415 

gaa cag ttc egg tgg ate gag ttc aag aca aac gca aac gca cag ate 1296 
Glu Gin Phe Arg Trp He Glu Phe Lys Thr Asn Ala Asn Ala Gin He 
420 425 430 

aac aca ctt get gga cga acc teg gtc ttg aga ggt tta cca tta gag 1344 
Asn Thr Leu Ala Gly Arg Thr Ser Val Leu Arg Gly Leu Pro Leu Glu 
435 ' 440 445 

gtc ata tec aat ggg tac caa ate tea etc gaa gaa gca aga agg gtt 1392 
Val He Ser Asn Gly Tyr Gin He Ser Leu Glu Glu Ala Arg Arg Val 
450 455 .460 

aag ttc aac acg ate gag acc act ttg acg cac age agt ggc cca get 1440 
Lys Phe Asn Thr He Glu Thr Thr Leu Thr His Ser Ser Gly Pro Ala 
465 470 475 480 

age tac gga ggg cca agg aag get gat get taa 1473 
Ser Tyr Gly Gly Pro Arg Lys Ala Asp Ala 
485 490 

<210> 10 
<211> 490 
<212> PRT 

<213> Brassica napus 
<400> 10 

Met Ala Arg Leu Ser Ser Leu Leu Ser Phe Ser Leu Ala Leu Leu lie 
1 ^ 5 10 15 

Phe Leu His Gly Ser Thr Ala Gin Gin Phe Pro Asn Glu Cys Gin Leu 
20 25 30 



Asp Gin Leu Asn Ala Leu Glu Pro Ser His Val Leu Lys Ala Glu Ala 
35 40 45 
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Gly Arg He Glu Val Trp Asp His His Ala Pro Gin Leu Arg Cys Ser 
50 55 60 

Gly Val Ser Phe Val Arg Tyr He He Glu Ser Lys Gly Leu Tyr Leu 
65 70 75 80 

Pro Ser Phe Phe Ser Thr Ala Lys Leu Ser Phe Val Ala Lys Gly Glu 
85 90 " 95 

Gly Leu. Met Gly Arg Val Val Pro Gly Cys Ala Glu Thr Phe Gin Asp 
100 105 HO. 

Ser Ser Val Phe Gin Pro Ser Gly Gly Ser Pro Ser Gly Glu Gly Gin 
115 120 125 

Gly Gin Gly Gin Gin Gly Gin Gly Gin Gly His Gin Gly Gin Gly Gin 
130 135 ' 140 

Gly Gin Gin Gly Gin Gin Gly Gin Gin Gly Gin Gin Ser Gin Gly Gin 
145 150 155 "* 160 

Gly Phe Arg Asp Met His Gin Lys Val Glu His He Arg Thr Gly Asp 
165 170 175 

Thr He Ala Thr His Pro Gly Val Ala Gin Trp Phe Tyr Asn Asp Gly 
180 185 190 

Asn Gin Pro Leu Val He Val Ser Val Leu Asp Leu Ala Ser His Gin 
195 200 " 205 

Asn Gin Leu Asp Arg Asn Pro Arg Pro Phe Tyr Leu Ala Gly Asn Asn 
210 215 ~ 220 

Pro Gin Gly Gin Val Trp He Glu Gly Arg Glu Gin Gin Pro Gin Lys 
225 230 235 240 

Asn He Leu Asn Gly Phe Thr Pro Glu Val Leu Ala Lys Ala Phe Lys 
245 250 " 255 

He Asp Val Arg Thr Ala Gin Gin Leu Gin Asn Gin Gin Asp Asn Arg 
260 ■ 265 270 

Gly Asn He He Arg Val Gin Gly Pro Phe Ser Val He Arg Pro Pro 
275 280 285 

Leu Arg Ser Gin Arg Pro Gin Glu Thr Glu Val Asn Gly Leu Glu Glu 
290 295 300 

Thr He Cys Ser Ala Arg Cys Thr Asp Asn Leu Asp Asp Pro Ser Asn 
305 310 315 " 320 

Ala Asp Val Tyr Lys Pro Gin Leu Gly Tyr He Ser Thr Leu Asn Ser 
325 330 335 

Tyr Asp Leu Pro He Leu Arg Phe Leu Arg Leu Ser Ala Leu Arg Gly 
340 345 350 

Ser He Arg Gin Asn Ala Met Val Leu Pro Gin Trp Asn Ala Asn Ala 
355 360 365 

Asn Ala Val Leu Tyr Val Thr Asp Gly Glu Ala His Val Gin Val Val 
370 375 380 

Asn Asp Asn Gly Asp Arg Val Phe Asp Gly Gin Val Ser Gin Gly Gin 
385 390 395 400 

Leu Leu Ser He Pro Gin Gly Phe Ser Val Val Lys Arg Ala Thr Ser 
405 410 415 

Glu Gin Phe Arg Trp He Glu Phe Lys Thr Asn Ala Asn Ala Gin He 
420 425 430 
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Asn Thr Leu Ala Gly Arg Thr Ser Val Leu Arg Gly Leu Pro Leu Glu 
435 440 445 

Val lie Ser Asn Gly Tyr Gin He Ser Leu Glu Glu Ala Arg Arg Val 
450 455 460 

Lys Phe Asn Thr He Glu Thr Thr Leu Thr His Ser Ser Gly Pro Ala 
465 470 475 480 

Ser Tyr Gly Gly Pro Arg Lys Ala Asp Ala 
485 490 



<210> 11 

<211> 1467 

<212> DNA 

<213> Brassica napus 

<220> 

<221> CDS 

<222> (1) . . (1464) 

<223> cruciferin 

<400> 11 

atg get egg etc tea tct ctt etc tct ttt tec tta gca ctt ttg act 48 
Met Ala Arg Leu Ser Ser Leu Leu Ser Phe Ser Leu Ala Leu Leu Thr 
15 10 15 

ttt etc cat ggc tct aca get caa cag ttt cca aac gag tgt cag eta 96 
Phe Leu His Gly Ser Thr Ala Gin Gin Phe Pro Asn Glu Cys Gin Leu 
20 25 30 

gac cag etc aat gca ctg gag ccg tea cac gta ctt aag get gag get 144 
Asp Gin Leu Asn Ala Leu Glu Pro Ser His Val Leu Lys Ala Glu Ala 
35 40 45 

ggt cgc ate gag gtg tgg gac cac cac get cct cag eta cgt tgc tct 192 
Gly Arg He Glu Val Trp Asp His His Ala Pro Gin Leu Arg Cys Ser 
50 55 60 

ggt gtc tec ttt gta cgt tac ate ate gag tct aag ggt etc tac ttg 240 
Gly Val Ser Phe Val Arg Tyr He He Glu Ser Lys Gly Leu Tyr Leu 
65 .70 75 80 

ccc tct ttc ttt age ace gcg agg etc tec ttc gtg get aaa gga gaa 288 
Pro Ser Phe Phe Ser Thr Ala Arg Leu Ser Phe Val Ala Lys Gly Glu 
85 90 95 

ggt ctt atg ggg aga gtg gtc ctg tgc gee gag aca ttc cag gac tea 336 
Gly Leu Met Gly Arg Val Val Leu Cys Ala Glu Thr Phe Gin Asp Ser 
100 105 110 

tea gtg ttt caa cca age ggt ggt age ccc ttc gga gaa ggt cag ggc 384 
Ser Val Phe Gin Pro Ser Gly Gly Ser Pro Phe Gly Glu Gly Gin Gly 
115 120 125 

caa gga caa caa ggt cag ggc caa ggc cac caa ggt caa ggc caa gga 432 
Gin Gly Gin Gin Gly Gin Gly Gin Gly His Gin Gly Gin Gly Gin Gly 
130 135 140 

caa cag ggc caa caa ggt cag caa gga caa cag agt caa ggc cag ggt 480 
Gin Gin Gly Gin Gin Gly Gin Gin Gly Gin Gin Ser Gin Gly Gin Gly 
145 150 155 160 

ttc cgt gat atg cac cag aaa gtg gag cac ata agg act ggg gac ace 528 
Phe Arg Asp Met His Gin Lys Val Glu His He Arg Thr Gly Asp Thr 
165 170 175 
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ate get aca cat ccc ggt gta gec caa tgg ttc tac aac gac gga aac 576 

lie Ala Thr His Pro Gly Val Ala Gin Trp Phe Tyr Asn Asp Gly Asn 

180 185 190 

caa cca ctt gtc ate gtt tec gtc etc gat tta gee age cac cag aat 624 
Gin Pro Leu Val lie Val Ser Val Leu Asp Leu Ala Ser His Gin Asn 
195 200 205 

cag etc gac cgc aac cca agg cca ttt tac tta gec gga aac aac cca 672 
Gin Leu Asp Arg Asn Pro Arg Pro Phe Tyr Leu Ala Gly Asn Asn Pro 
210 215 220 

caa ggc caa gta tgg ata gaa gga cgc gag caa cag cca caa aag aac 720 
Gin Gly Gin Val Trp lie Glu Gly Arg Glu Gin Gin Pro Gin Lys Asn 
225 230 235 240 

ate ctt aat ggc ttc aca cca gag gtt ctt get aaa get ttc aag ate 768 
He Leu Asn Gly Phe Thr Pro Glu Val Leu Ala Lys Ala Phe Lys lie 
245 250 255 

gat gtt agg aca gcg caa caa ctt cag aac cag caa gac aac cgt gga 816 
Asp Val Arg Thr Ala Gin Gin Leu Gin Asn Gin -Gin Asp Asn Arg Gly 
260 265 270 " " 

aac att ate cga gtc caa ggc cca ttc agt gtc att agg ccg cct ttg 864 
Asn He He Arg Val Gin Gly Pro Phe Ser Val He Arg Pro Pro Leu 
275 280 285 

agg agt cag aga ccg cag gag gaa gtt aac ggt tta gaa gag ace ata 912 
Arg Ser Gin Arg Pro Gin Glu Glu Val Asn Gly Leu Glu Glu Thr He 
290 295 300 

tgc age gcg agg tgc acc gat aac etc gat gac cca tct aat get gac 960 
Cys Ser Ala Arg Cys Thr Asp Asn Leu Asp Asp Pro Ser Asn Ala Asp 
305 310 315 320 

gta tac aag cca cag etc ggt tac ate age act ctg aac age tat gat 1008 
Val Tyr Lys Pro Gin Leu Gly Tyr He Ser Thr Leu Asn Ser Tyr Asp 
325 330 335 

etc ccc ate ctt cgc ttc ctt cgt etc tea gec etc cgt gga tct ate 1056 
Leu Pro He Leu Arg Phe Leu Arg Leu Ser Ala Leu Arg Gly Ser He 
340 345 350 

cgt caa aac gcg atg gtg ctt cca cag tgg aac gca aac gca aac gcg 1104 
Arg Gin Asn Ala Met Val Leu Pro Gin Trp Asn Ala Asn Ala Asn Ala 
355 360 365 

gtt etc tac gtg aca gac ggg gaa gee cat gtg cag gtg gtt aac gac 1152 
Val Leu Tyr Val Thr Asp Gly Glu Ala His Val Gin Val Val Asn Asp 
370 375 380 

aac ggt gac aga gtg ttc gac gga caa gtc tct caa gga .cag eta ctt 1200 
Asn Gly Asp Arg Val Phe Asp Gly Gin Val Ser Gin Gly Gin Leu Leu 
385 390 395 400 

tec ata cca caa ggt ttc tec gtg gtg aaa cgc gca aca age gaa cag 1248 
Ser He Pro Gin Gly Phe Ser Val Val Lys Arg Ala Thr Ser Glu Gin 
405 410 415 

ttc egg tgg ate gag ttc aag aca aac gca aac gca cag ate aac aca 1296 
•Phe Arg Trp He Glu Phe Lys Thr Asn Ala Asn Ala Gin He Asn Thr 
420 425 430 

ctt get gga cga acc teg gtc ttg aga ggt tta cca tta gag gtc ata 1344 
Leu Ala Gly Arg Thr Ser Val Leu Arg Gly Leu Pro Leu Glu Val He 
435 440 445 
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tec aat ggg tac caa ate tea etc gaa gaa gca aga agg gtt aag ttc 1392 
Ser Asn Gly Tyr Gin lie Ser Leu Glu Glu Ala Arg Arg Val Lys Phe 
450 455 460 

aac.acg ate gag ace act ttg acg cac age agt ggc cca get age tac 1440 
Asn Thr lie Glu Thr Thr Leu Thr His Ser Ser Gly Pro Ala Ser Tyr 
465 470 475 480 

gga ggg cca agg aag*^ get gat get taa' 1467 
Gly Gly Pro Arg Lys Ala Asp Ala 
485 

<210> 12 
<211> 488 
<212> PRT . 
• <213> Brass ica napus 

<400> 12 

Met Ala Arg Leu Ser Ser Leu Leu Ser Phe Ser Leu Ala Leu Leu Thr 
1 5 10 15 * 

Phe Leu His Gly Ser Thr Ala Gin Gin Phe Pro Asn Glu Cys.Gln Leu 
20 25 30 

Asp Gin Leu Asn Ala Leu Glu Pro Ser His Val Leu Lys Ala Glu Ala 
35 40 45 

Gly Arg lie Glu Val Trp Asp His His Ala Pro Gin Leu Arg Cys Ser ■ 
50 55 60 

Gly Val Ser Phe Val Arg Tyr lie He Glu Ser Lys Gly Leu Tyr Leu 
65 70 75 80 

Pro Ser Phe Phe Ser Thr Ala Arg Leu Ser Phe Val Ala Lys Gly Glu 
85 '90 " 95 

Gly Leu Met Gly Arg Val Val Leu Cys Ala Glu Thr Phe Gin Asp Ser 
100 105 110 

Ser Val Phe Gin Pro Ser Gly Gly Ser Pro Phe Gly Glu Gly Gin Gly 
115 120 125 

Gin Gly Gin Gin Gly Gin Gly Gin Gly His Gin Gly Gin Gly Gin Gly 
130 135 140 

Gin Gin Gly Gin Gin Gly Gin Gin Gly Gin Gin Ser Gin Gly Gin Gly 
145 150 155 160 

Phe Arg Asp Met His Gin Lys Val Glu His He Arg Thr Gly Asp Thr 
165 170 " 175 

He Ala Thr His Pro Gly Val Ala Gin Trp Phe Tyr Asn Asp Gly Asn 
180 185 190 

Gin Pro Leu Val He Val Ser Val Leu Asp Leu Ala Ser His Gin Asn 
195 200 205 

Gin Leu Asp Arg Asn Pro Arg Pro Phe Tyr Leu Ala Gly Asn Asn Pro 
210 215 220 

Gin Gly Gin Val Trp He Glu Gly Arg Glu Gin Gin Pro Gin Lys Asn 
225 230 235 240 

He Leu Asn Gly Phe Thr Pro Glu Val Leu Ala Lys Ala Phe Lys He 
245 250 255 

Asp Val Arg Thr Ala Gin Gin Leu Gin Asn Gin Gin Asp Asn Arg Gly 
260 265 270 



WO 03/078629 ■ ■ W W PCT/EP03/02735 

13 

Asn lie lie Arg Val Gin Gly Pro Phe Ser Val lie Arg Pro Pro Leu 
275 280 285 

Arg Ser Gin Arg Pro Gin Glu Glu Val Asn Gly Leu Glu Glu Thr lie 
290 295 • 300 

Cys Ser Ala Arg Cys Thr Asp Asn Leu Asp Asp - Pro Ser Asn Ala "Asp 
305 310 315 320 

Val Tyr Lys Pro Gin Leu Gly Tyr lie Ser Thr Leu Asn Ser Tyr Asp 
325 330 335 

Leu Pro lie Leu Arg Phe Leu Arg Leu Ser Ala Leu Arg Gly Ser lie 
340 345 350 

Arg Gin Asn Ala Met Val Leu Pro Gin Trp Asn Ala Asn Ala Asn Ala 
355 360 365 

Val Leu Tyr Val Thr Asp Gly Glu Ala His Val Gin Val. Val Asn Asp 
370 375 380 

Asn Gly Asp Arg Val Phe Asp Gly Gin Val Ser Gin Gly Gin Leu Leu 
385 390 395 400 

Ser lie Pro Gin Gly Phe Ser Val Val Lys Arg Ala Thr Ser Glu Gin 
405 410 415 

Phe Arg Trp lie Glu Phe Lys Thr Asn Ala Asn Ala Gin lie Asn Thr 
420 425 430 

Leu Ala Gly Arg Thr Ser Val Leu Arg Gly Leu Pro Leu Glu Val He 
435 440 445 

Ser Asn Gly Tyr Gin He Ser Leu Glu Glu Ala Arg Arg Val Lys Phe 
450 455 460 

Asn Thr He- Glu Thr Thr Leu Thr His Ser Ser Gly Pro Ala Ser Tyr 
465 470 475 480 

Gly Gly Pro Arg Lys Ala Asp Ala 
485 



<210> 13 
<211> 1491 
<212> DNA 

<213> Brassica napus 

<220> 

<221> CDS 

<222> (1) . . (1488) 

<223> cruciferin BnC2 

<400> 13 

atg get cga etc teg tct ctt etc tat ttt teg ata aca gtt ttg ate 48 

Met Ala Arg Leu Ser Ser Leu' Leu Tyr Phe Ser He Thr Val Leu He 
15 10 15 

ttt etc cat ggc tct aca get caa cag ttt cca aac gag tgc caa eta 96 
Phe Leu His Gly Ser Thr Ala Gin Gin Phe Pro Asn Glu Cys Gin Leu 
20 25 30 

gac cag etc aat gcg ctg gag ccg tea cac gta ctt aag gee gag get 144 
Asp Gin Leu Asn Ala Leu Glu Pro Ser His Val Leu Lys Ala Glu Ala 
35 40 45 

ggt cgc ate gaa gtg tgg gac cac cac get cct cag eta cgc tgc tct 192 
Gly Arg He Glu Val Trp Asp His His Ala Pro Gin Leu Arg Cys Ser 
50 55 60 
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ggt gtc tec 
Gly Val Ser 
65 


ttc 
Phe 


gta 
Val 


cgt 
Arg 
70 


tac 
Tyr 


ata 
He 


ate 
He 


gag 
Glu 


tct 
Ser 
75 


cag 
Gin 


ggt 
Gly 


eta 
Leu 


tac 
Tyr 


ttg 
Leu 
80 


240 


ccc tct ttc 
Pro Ser Phe 


tta 
Leu 


aat 
Asn 
85 


ace 
Thr 


gcg 
Ala 


aac 
Asn 


gtc 
Val 


tct 
Ser 
90 


ttc 
Phe 


gtt 

Val 


get 
Ala 


aaa 
Lys 


gga 
Gly 
95 


caa 
Gin 


288 


ggc ctt atg 
Gly Leu Met 


ggg 

Gly 
100 


aga 
Arg 


gtg 
Val 


gtc 
Val 


cct 
Pro 


gga 
Gly 
105 


tgc 
Cys 


get 
Ala 


gag 
Glu 


act 
Thr 


ttc 
Phe 
110 


cag 
Gin 


gac 
Asp 


336 


tea tea gta 
Ser Ser Val 
115 


ttc 
Phe 


caa 
Gin 


cca 
Pro 


ggc 
Gly 


agt 
Ser 
120 


ggc 

Gly 


age 
Ser 


ccc 
Pro 


ttc 
Phe 


gga 
Gly 
125 


gaa 
Glu 


ggt 
Gly 


caa 
Gin 


384 


ggc caa ggt 
Gly Gin Gly 
. 130 


cag 
Gin 


cag 
Gin 


ggt 

Gly 


cag 
Gin 
135 


ggg 

Gly 


caa 
Gin 


ggt 

Gly 


cag ggt 
Gin Gly 
140 


cag 
Gin 


ggt 

Gly 


caa 
Gin 


ggc 

Gly 


432 


aag ggc caa 
Lys Gly Gin 
145 


cag 
Gin 


ggt 
Gly 


caa 
Gin 
150 


ggc 
Gly 


aag 
Lys 


ggc 
Gly 


caa 
Gin 


cag ggt 
Gin Gly 
155 


caa 
Gin 


tec 
Ser 


cag 
Gin 


ggc 

Gly 
160 


480 


caa cag ggt 
Gin Gin Gly 


caa 
Gin 


ggt 

Gly 
165 


caa 
Gin 


ggt 

Gly 


ttc 
Phe 


cgt 
Arg 


gat 
Asp 
170 


atg 
Met 


cac 
His 


cag 
Gin 


aaa 
Lys 


gta 
Val 
175 


gag 
Glu 


528 


cac ata agg 
His He Arg 


age 
Ser 
180 


ggc 
Gly 


gac 
Asp 


ace 
Thr 


att 
He 


get 
Ala 
185 


aca 
Thr 


cat 
His 


ccc 
Pro 


ggt 

Gly 


gta 
Val 
190 


get 
Ala 


caa 
Gin 


• 576 


tgg ttc tac 
Trp Phe Tyr 
195 


aac 
Asn 


aat 
Asn 


gga 

Gly 


aac 
Asn 


caa 
Gin 
200 


cct 
Pro 


ctt 
Leu 


gtc 
Val 


ate 
lie 


gtt 
Val 
205 


gee 
Ala 


gtc 
Val 


atg 
Met 


624 


gat. tta get 
Asp Leu Ala 
210 


age 
Ser 


cac 
His 


cag 
Gin 


aac 
Asn 
215 


cag 
Gin 


ctt' 
Leu 


gac 
Asp 


cgc aac 
Arg Asn 
220 


cca 
Pro 


age 
Ser 


caa 
Gin 


ttt 
Phe 


672 


tac tta gca 
Tyr Leu Ala 
225 


gga 
Gly 


aaa 
Lys 


aac 
Asn 
230 


cca 
Pro 


caa 
Gin 


ggc 

Gly 


caa 
Gin 


tea tgg 
Ser Trp 
235 


eta 
Leu 


cac 
His 


gga 

Gly 


cga 
Arg 
240 


720 


ggg caa cag 
Gly Gin Gin 


cca 
Pro 


caa 
Gin 
245 


aac 
Asn 


aac 
Asn 


ate 
He 


ctt 
Leu 


aat 
Asn 
250 


ggc ttc 
Gly Phe 


tct 
Ser 


cca 
Pro 


gag 
Glu 
255 


gtt 

Val 


768 


ctt get caa 
Leu Ala Gin 


gcg 
Ala 
260 


ttc 
Phe 


aag 
Lys 


ate 
He 


gat 
Asp 


gtt 
Val 
265 


agg 
Arg 


aca gcg 
Thr Ala 


caa 
Gin 


caa 
Gin 
270 


ctt 
Leu 


cag 
Gin 


816 


aac cag caa 
Asn Gin Gin 
275 


gat 
Asp 


aac 
Asn 


egg 
Arg 


gga 
Gly 


aac 
Asn 
280 


att 
He 


gtc 
Val 


cgt gtc 
Arg Val 


caa 
Gin 
285 


ggc 

Gly 


ccc 
Pro 


ttc 
Phe 


864 


ggt gtt att 
Gly Val He 
290 


agg 
Arg 


ccg 
Pro 


cca 
Pro 


ttg 
Leu 
295 


aaa 
Lys 


age 
Ser 


cag 
Gin 


aga cca 
Arg Pro 
300 


cag 
Gin 


gag 
Glu 


aca 
Thr 


gaa 
Glu 


912 


get aac ggt 
Ala Asn Gly 
305 


eta 
Leu 


gaa 
Glu 


gag 
Glu 
310 


acc 
Thr 


ata 
He 


tgc 
Cys 


age 
Ser 


gca agg 
Ala Arg 
315 


tgc 
Cys 


acg 
Thr 


gat 
Asp 


aac 
Asn 
320 


960 


etc gat gac 
Leu Asp Asp 


cca 
Pro 


tct 
Ser 
325 


aac 
Asn 


gcg 
Ala 


gat 
Asp 


gtg 
Val 


tat 
Tyr 
330 


aag 
Lys 


cca 
Pro 


cag 
Gin 


ctt 
Leu 


ggt 
Gly 
335 


tac 
Tyr 


1008 




WO 03/078629 WW PCT/EP03/0273S 

15 

ate age att ctt aac agt tat gat eta ccc ate ctt cgc gta ctt cgc 1056 
lie Ser lie Leu Asn Ser Tyr Asp Leu Pro He Leu Arg Val Leu Arg 
340 345 350 

etc tea gee etc cgt gga tea ate cgt caa aat gca atg gtt ctt cca 1104 
Leu Ser Ala Leu Arg Gly Ser He Arg Gin Asn Ala Met Val Leu Pro 
355 360 365 

cag tgg aag tea aag tea aac gcg gtt etc tac gtg aca gac ggg gaa 1152 
Gin Trp Lys Ser Lys Ser Asn Ala Val Leu Tyr Val Thr Asp Gly Glu 
370 375 380 

gee caa ata cag gtg gtt aac gac aac ggt gac aga gtg ttc gat gga 1200 
Ala Gin He Gin Val Val Asn Asp Asn Gly Asp Arg Val Phe Asp Gly 
385 390 395 400 

caa gtc tct caa ggg cag eta ctt tec att cca caa gga ttc tec gtt 1248 
Gin Val Ser Gin Gly Gin Leu Leu Ser He Pro Gin Gly Phe Ser Val 
405 410 415 

gtg aaa cgc gca aca age gat cag ttc agg tgg ata gaa ttc aag aca 1296 
Val Lys Arg Ala Thr Ser Asp Gin Phe Arg Trp He Glu Phe Lys Thr 
420 425 430 

aac gca aac gee cag ate aac act ctt get gga cgt ace tea gtc atg 1344 
Asn Ala Asn Ala Gin He Asn Thr Leu Ala Gly Arg Thr Ser Val Met 
435 440 445 

aga ggt tta cca tta gag gtc ata gec aat ggg tac caa ate tea ctt 1392 
Arg Gly Leu Pro Leu Glu Val He Ala Asn Gly Tyr Gin He Ser Leu 
450 455 460 

gaa gaa gca aga agg gtt aag ttc aac aca ata gag ace act ttg ace 1440 
Glu Glu Ala Arg Arg Val Lys Phe Asn Thr He Glu Thr Thr Leu Thr 
465 470 475 480 

cac agt agt ggc cca gcg age tac gga agg cca agg aag get gat get 1488 
His Ser Ser Gly Pro Ala Ser Tyr Gly Arg Pro Arg Lys Ala Asp Ala 
485 490 495 



tga 

<210> 14 
<211> 496 
<212> PRT 

<213> Brassica napus 
<400> 14 

Met Ala Arg Leu Ser Ser Leu Leu Tyr Phe Ser He Thr Val Leu He 
15 10 .15 

Phe Leu His Gly Ser Thr Ala Gin Gin Phe Pro Asn Glu Cys Gin Leu 
20 25 30 

Asp Gin Leu Asn Ala Leu Glu Pro Ser His Val Leu Lys Ala Glu Ala 
35 40 45 

Gly Arg He Glu Val Trp Asp His His Ala Pro Gin Leu Arg Cys Ser 
50 55 60 

Gly Val Ser Phe Val Arg Tyr He He Glu Ser Gin Gly Leu Tyr Leu 
65 70 75 80 

Pro Ser Phe Leu Asn Thr Ala Asn Val Ser Phe Val Ala Lys Gly Gin 
85 90 95 



1491 



Gly Leu Met Gly Arg Val Val Pro Gly Cys Ala Glu Thr Phe Gin Asp 
100 105 110 
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Ser Ser Val Phe Gin Pro Gly Ser Gly Ser Pro Phe Gly Glu Gly Gin 
115 120 125 

Gly Gin Gly Gin Gin Gly Gin Gly Gin Gly Gin Gly Gin Gly Gin Gly 
130 135 140 

Lys Gly Gin Gin Gly Gin Gly Lys Gly Gin Gin Gly Gin Ser Gin Gly 
145 150 155 160 

Gin Gin Gly Gin Gly Gin Gly Phe Arg Asp Met His Gin Lys Val Glu 
165 170 175 

His He Arg Ser Gly Asp Thr He Ala Thr His Pro Gly Val Ala Gin 
180 185 190 

Trp Phe Tyr Asn Asn Gly Asn Gin Pro Leu Val lie Val Ala Val Met 
195 200 205 

Asp Leu Ala Ser His Gin Asn Gin Leu Asp Arg Asn Pro Ser Gin Phe 
210 215 220 

Tyr Leu Ala Gly Lys Asn Pro Gin Gly Gin Ser Trp Leu His Gly Arg 
225 230 235 240 

Gly Gin Gin Pro Gin Asn Asn He Leu Asn Gly Phe Ser Pro Glu Val 
245 250 255 

Leu Ala Gin Ala Phe Lys He Asp Val Arg Thr Ala Gin Gin Leu Gin 
260 265 270 

Asn Gin Gin Asp Asn Arg Gly Asn He Val Arg Val Gin Gly Pro Phe 
275 280 285 

Gly Val He Arg Pro Pro Leu Lys Ser Gin Arg Pro Gin Glu Thr Glu 
290 295 300 

Ala Asn Gly Leu Glu Glu Thr He Cys Ser Ala Arg Cys Thr Asp Asn 
305 310 315 320 

Leu Asp Asp Pro Ser Asn Ala Asp Val Tyr Lys Pro Gin Leu Gly Tyr 
325 330 335 

He Ser He Leu Asn Ser Tyr Asp Leu Pro He Leu Arg Val Leu Arg 
3.40 345 350 

Leu Ser Ala Leu Arg Gly Ser He Arg Gin Asn Ala Met Val Leu Pro 
355 360 365 

Gin Trp Lys Ser Lys Ser Asn Ala Val Leu Tyr Val Thr Asp Gly Glu 
370 375 380 

Ala Gin He Gin Val Val Asn Asp Asn Gly Asp Arg Val Phe Asp Gly 
385 390 395 400 

Gin Val Ser Gin Gly Gin Leu Leu Ser He Pro Gin Gly Phe Ser Val 
405 410 415 

Val Lys Arg Ala Thr Ser Asp Gin Phe Arg Trp He Glu Phe Lys Thr 
420 425' 430 

Asn Ala Asn Ala Gin He Asn Thr Leu Ala Gly Arg Thr Ser Val Met 
435 440 445 

Arg Gly Leu Pro Leu Glu Val He Ala Asn Gly Tyr Gin He Ser Leu 
450 455 " 460 

Glu Glu Ala Arg Arg Val Lys Phe Asn Thr He Glu Thr Thr Leu Thr 
465 470 475 480 

His Ser Ser Gly Pro Ala Ser Tyr Gly Arg Pro Arg Lys Ala Asp Ala 
485 490 495 
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<210> 15 
<211> 555 
<212> DNA 

<213> Brass ica napus 

<220> 

<221> CDS 

<222> (1) . . (552) 

<223> cruciferin cru4 

<400> 15 

ttg tgc aca atg aga tgc acc gaa aac ctt gat gac ccg tea agt get 48 . 

Leu Cys Thr Met Arg Cys Thr Glu Asn Leu Asp Asp Pro Ser Ser Ala 
15 10 15 

gat gtc tac aag cca teg etc gga tac att age aca etc aac age tac 96 
Asp Val Tyr Lys Pro Ser Leu Gly Tyr lie Ser Thr Leu Asn Ser Tyr 
20 25 30 

aac etc cct ate etc aga ttc etc cgc ctt age get ctt cgt ggc tec 144 
Asn Leu Pro lie Leu Arg Phe Leu Arg Leu Ser Ala Leu Arg Gly Ser 
35 40 45 

ate cat aac aac get atg gtg ctg ccg caa' tgg aac gtg aac gca aac 192 
lie His Asn Asn Ala Met Val Leu Pro Gin Trp Asn Val Asn Ala Asn 
50 55 60 

gcg gca etc tac gtg aca aag ggg aag get cat ata cag atg gtg aac 240 
Ala A'ia Leu Tyr Val Thr Lys Gly Lys Ala His lie Gin Met Val Asn 
65 70 -75 8*0 

gac aac gga caa aga gtg ttt gac caa gag ate tec cag gga cag tta 288 
Asp Asn Gly Gin Arg Val Phe Asp Gin Glu lie Ser Gin Gly Gin Leu 

85 .90 95 

ctt gtc gtg cca caa ggc ttc gcg gtc gtg aaa cgt gee aca age caa 336 
Leu Val Val Pro Gin Gly Phe Ala Val Val Lys Arg Ala Thr Ser Gin 
100 105 110 

cag ttc cag tgg ate gag ttc aag age aac gac aac gca cag ate aac 384 
Gin Phe Gin Trp lie Glu Phe Lys Ser Asn Asp Asn Ala Gin lie Asn 
115 .120 125 

aca etc gcg gga cgc acc tea gtc atg aga ggt tta cca ctt gag gtt 432 
Thr Leu Ala Gly Arg Thr Ser Val Met Arg Gly Leu Pro Leu Glu Val 
130 135 ' 140 

ata tec aac ggg tat cag ate tea ccc caa gaa get aga agt gtt aag 480 
He Ser Asn Gly Tyr Gin He Ser Pro Gin Glu Ala Arg Ser Val Lys 
145 150 155 ~ 160 

ttc age act ctt gag acc aca ttg act caa age agt ggt cct atg ggc 528 
Phe Ser Thr Leu Glu Thr Thr Leu Thr Gin Ser Ser Gly Pro Met Gly 
165 170 " 175 

tac ggt atg cct aga gtc gag get tga 555 
Tyr Gly Met Pro Arg Val Glu Ala 
180 

<210> 16 ' 
<211> 184 
<212> PRT 

<213> Brassica napus 
<400>16 

Leu Cys Thr Met Arg Cys Thr Glu Asn Leu Asp Asp Pro Ser Ser Ala 
15 10 15 
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Asp Val Tyr Lys Pro Ser Leu Gly Tyr lie Ser Thr Leu Asn Ser Tyr 
20 25 30 

Asn Leu Pro lie Leu Arg Phe Leu Arg Leu Ser Ala Leu Arg Gly Ser 
35 40 45 

He His Asn Asn Ala Met Val Leu Pro Gin Trp Asn Val Asn Ala Asn 
50 - ^55 60 

Ala Ala Leu Tyr Val Thr Lys Gly Lys Ala His He Gin Met Val Asn 
65 70 75 80 

Asp Asn Gly Gin Arg Val Phe Asp Gin Glu He Ser Gin Gly Gin Leu 
85 90 95 

Leu Val Val Pro Gin Gly Phe Ala Val Val Lys Arg Ala Thr Ser Gin 
100 105 HO 

Gin Phe Gin Trp He Glu Phe Lys Ser Asn Asp Asn Ala Gin He Asn 
115 120 125 

Thr Leu Ala Gly Arg Thr Ser Val Met Arg Gly Leu Pro Leu Glu Val 
130 135 140 

He Ser Asn Gly Tyr Gin He Ser Pro Gin Glu Ala Arg Ser Val Lys 
145 150 155 160 

Phe Ser Thr Leu Glu Thr Thr Leu Thr Gin Ser Ser Gly Pro Met Gly 
165 170 " 175 

Tyr Gly Met Pro Arg Val Glu Ala 
180 



<210> 17 
<211> 1530 
<212> DNA 

<213> Brassica napus 

<220> 

<221> CDS 

<222> (1)..(1527) 

<223> cruciferin cru4 

<400> 17 

atg gtt aaa gtt cct cat etc etc gtc gca acg ttc ggg gtt etc etc 48 

Met Val Lys Val Pro His Leu Leu Val Ala Thr Phe Gly Val Leu Leu 

1 5 10 • 15 

gtc etc aac ggc tgt etc gea agg cag teg eta ggg gtt cct cct cag 96 
Val Leu Asn Gly Cys Leu Ala Arg Gin Ser Leu Gly Val Pro Pro Gin 
20 25 30 

eta ggg aac gcg tgt aac etc gat aac tta gac gtt etc cag cct acc 144 
Leu Gly Asn Ala Cys Asn Leu Asp Asn Leu Asp* Val Leu Gin Pro Thr 
35 40 45 

gaa act ate aag age gag get ggt egg gtc gag tac tgg gat cac aac 192 
Glu Thr He Lys Ser Glu Ala Gly Arg Val Glu Tyr Trp Asp His Asn 
50 55 60 

aat cct cag ate cga tgt get ggt gtc tct gtc tct cgt gtt ata ate 240 
Asn Pro Gin He Arg Cys Ala Gly Val Ser Val Ser Arg Val He He 
65 70 75 80 

gaa caa ggc ggt etc tac ctt cct acc ttc ttc age tec ccc aaa att 288 
Glu Gin Gly Gly Leu Tyr Leu Pro Thr Phe Phe Ser Ser Pro Lys He 
85 90 95 
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tea tac gtt gtt caa gga atg ggt att age gga aga gtg gtc cct gga 336 

Ser Tyr Val Val Gin. Gly Met Gly lie Ser Gly Arg Val Val Pro Gly 
100 105 110 

tgc gcg gaa acc ttc atg gac teg cag cct atg caa gga caa caa caa 384 
Cys Ala Glu Thr Phe Met Asp Ser Gin Pro Met Gin Gly Gin Gin Gin 
115 120 125 

ggt caa cca tgg cag gga caa caa gga caa cag ggt cag cag gga caa 432 
Gly Gin Pro.Trp Gin Gly Gin Gin Gly Gin Gin Gly Gin Gin Gly Gin 
130 135 140 

caa ggt caa cag ggt cag cag gga caa caa ggt caa cag ggt cag cag 480 
Gin Gly Gin Gin Gly Gin Gin Gly Gin Gin Gly Gin Gin Gly Gin Gin 
145 150 155 160 

ggt caa cag gga cag cag ggt cag cag cag caa ggg ttc cgt gac atg 528 
Gly Gin Gin Gly Gin Gin Gly Gin Gin Gin Gin Gly Phe Arg Asp Met 
165 170 175 

cac cag aag gtc gaa cat gtt cga cat gga gac ate att gee att act 576 
His Gin Lys Val Glu His Val Arg His Gly Asp lie He Ala He Thr 
180 185 190 

gca ggc tct tec cat tgg ate tac aac acc ggt gac cag cca ctt gtc 624 
Ala Gly Ser Ser His Trp He Tyr Asn Thr Gly Asp Gin Pro Leu Val 
195 200 205 

att ate tgc ctt etc gac att gee aac tac caa aac caa etc gac cgc 672 
lie He Cys Leu Leu Asp He Ala Asn Tyr Gin Asn Gin Leu Asp Arg 
210 215 220 

aac cca- aga acg ttc cgt ctg gee gga aac aac cca cag ggc ggt tec 720 
Asn Pro Arg Thr Phe Arg Leu Ala Gly Asn Asn Pro Gin Gly Gly Ser 
225 230 235 .240 

cag cag cag cag caa caa caa cag aac atg ttg age ggg ttc gac cct 768 
Gin Gin Gin Gin Gin Gin Gin Gin Asn Met Leu Ser Gly Phe Asp Pro 
245 250 255 

cag gtc eta gee cag gca ttg aaa ate gac gtt agg ttg get cag gag 816 
Gin Val Leu Ala Gin Ala Leu Lys He Asp Val Arg Leu Ala Gin Glu 
260 265 270 

ctt cag aac caa caa gac age aga gga aac ate gtt cgt gtt aag gga 864 
Leu Gin Asn Glh Gin Asp Ser Arg Gly Asn He Val Arg Val Lys Gly 
275 280 285 

cct ttc cag gtt gtg agg ccg cct ctt aga cag cca tac gag agt gag 912 
Pro Phe Gin Val Val Arg Pro Pro Leu Arg Gin Pro Tyr Glu Ser Glu 
290 295 300 

cag tgg aga cac ccc cgt ggc cca cca caa age cca caa gac aac ggc 960 
Gin Trp Arg His Pro Arg Gly Pro Pro Gin Ser Pro Gin Asp Asn Gly 
305 310 315 320 

ttg gag gag act ate tgc age atg agg acc cac gag aac att gat gac 1008 
Leu Glu Glu Thr He Cys Ser Met Arg Thr His Glu Asn He Asp Asp 
325 330 335 

cca gee cgt get gac gtg tat aag ccc aac etc ggc cgt gtg act age 1056 
Pro Ala Arg Ala Asp Val Tyr Lys Pro Asn Leu Gly Arg Val Thr Ser 
340 345 350 

gtc aac age tac act tta ccc ate ttg cag tat ate aga etc age gee 1104 
Val Asn Ser Tyr Thr Leu Pro He Leu Gin Tyr He Arg Leu Ser Ala 
355 360 365 
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acc cgt ggc att etc cag ggt aat gcg atg gtg ctt ccg aaa tac aac 1152 
Thr Arg Gly He Leu Gin Gly Asn Ala Met Val Leu Pro Lys Tyr Asn 
370 375 380 

atg aac gcg. aac gag ate ttg tac tgc act caa gga caa gca agg att 1200 
Met Asn Ala Asn Glu He Leu Tyr Cys Thr Gin Gly Gin Ala Arg He 
385 390 395 400 

caa gtg gtg aac gac aac gga cag aac gtg ctg gac cag cag gtg cag 1248 
Gin Val Val Asn Asp Asn Gly Gin Asn Val Leu Asp Gin Gin Val Gin 
405 410 415 

aag gga cag etc gtg gtc ate cca caa gga ttc gec tat gtt gtc cag 1296 
Lys Gly Gin Leu Val Val He Pro Gin Gly Phe Ala Tyr Val Val Gin 
420 425 430 

tec cac caa aac aac ttc gaa tgg att tct ttc aag aca aac get aac 1344 
Ser His Gin Asn Asn Phe Glu Trp He Ser Phe Lys Thr Asn Ala Asn 
435 440 445 

gcg atg gtc age act ttg gec ggt aga acc teg gee ttg agg gca ttg, 1392 
Ala Met Val Ser Thr Leu Ala Gly Arg Thr Ser Ala Leu Arg Ala Leu 
450 455' 460" 

cca eta gag gtc ata acc aac get ttc caa att tct etc gag gaa get 1440 
Pro Leu Glu Val He Thr Asn Ala Phe Gin He Ser Leu Glu Glu Ala 
465 470 475 480 

aga agg ate aag ttc aac acg ctt gag acc act ttg act cgt gcg cgc 1488 
Arg Arg He Lys Phe Asn Thr Leu Glu Thr Thr Leu Thr Arg Ala Arg 
485 490 495 

ggt gga caa ccc cag ttg ate gag gag ata gtc gag get taa 1530 
Gly Gly Gin Pro Gin Leu He Glu Glu He Val Glu Ala 
500 505 

<210> 18 
<211> 509 
<212> PRT 

<213> Brassica napus 
<400> 18 

Met Val Lys Val Pro His Leu Leu Val Ala Thr Phe Gly Val Leu Leu 
15' 10 15 

Val Leu Asn Gly Cys Leu Ala Arg Gin Ser Leu Gly Val Pro Pro Gin 
20 25 30 

Leu Gly Asn Ala Cys Asn Leu Asp Asn Leu Asp Val Leu Gin Pro Thr 
35 40 45 

Glu Thr He Lys Ser Glu Ala Gly Arg Val Glu Tyr Trp Asp His Asn 
50 55 60 

Asn Pro Gin He Arg Cys Ala Gly Val Ser Val Ser Arg Val He He 
65 70 ' 75 80 

Glu Gin Gly Gly Leu Tyr Leu Pro Thr Phe Phe Ser Ser Pro Lys He 
85 90 95 

Ser Tyr Val Val Gin Gly Met Gly He Ser Gly Arg Val Val Pro Gly 
100 105 110 

Cys Ala Glu Thr Phe Met Asp Ser Gin Pro Met Gin Gly Gin Gin Gin 
115 120 125 

Gly Gin Pro Trp Gin Gly Gin Gin Gly Gin Gin Gly Gin Gin Gly Gin 
130 135 *" 140 
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Gin Gly Gin Gin Gly Gin Gin Gly Gin Gin Gly Gin Gin Gly Gin Gin 
145 150 155 160 

Gly Gin Gin Gly Gin Gin Gly Gin Gin Gin Gin Gly Phe Arg Asp Met 
165 170 * 175 

His Gin Lys Val Glu His Val Arg His Gly Asp He He Ala He Thr 
180 185 190 

Ala Gly Ser Ser His Trp He Tyr Asn Thr Gly Asp Gin Pro Leu Val 
195 200 205 

He He Cys Leu Leu Asp He Ala Asn Tyr Gin Asn Gin Leu Asp Arg 
210 215 220 

Asn Pro Arg Thr Phe Arg Leu Ala Gly Asn Asn Pro Gin Gly Gly Ser 
225 230 235 240 

Gin Gin Gin Gin Gin Gin Gin Gin Asn Met Leu Ser Gly Phe Asp Pro 
245 250 255 

Gin Val Leu Ala Gin Ala Leu Lys He Asp Val Arg Leu Ala Gin Glu 
260 265 270 

Leu Gin Asn Gin Gin Asp Ser Arg Gly Asn He Val Arg Val Lys Gly 
275 280 285 

Pro Phe Gin Val Val Arg Pro Pro Leu Arg Gin Pro Tyr Glu Ser Glu 
290 295 300 

Gin Trp Arg His Pro Arg Gly Pro Pro Gin Ser Pro Gin Asp Asn Gly 
305 310 315 320 

Leu Glu Glu Thr He Cys Ser Met Arg Thr His Glu Asn He Asp Asp 
325 330 335 

Pro Ala Arg Ala Asp Val Tyr Lys Pro Asn Leu Gly Arg Val Thr Ser 
340 345 350 

Val Asn Ser Tyr Thr Leu Pro He Leu Gin Tyr He Arg Leu Ser Ala 
355 360 365 

Thr Arg Gly He Leu Gin Gly Asn Ala Met Val Leu Pro Lys Tyr Asn 
370 .375 380 

Met Asn Ala Asn Glu He Leu Tyr Cys Thr Gin Gly Gin Ala Arg He 
385 390 395 400 

Gin Val Val Asn Asp Asn Gly Gin Asn Val Leu Asp Gin Gin Val Gin 
405 410 415 

Lys Gly Gin Leu Val Val He Pro Gin Gly Phe Ala Tyr Val Val Gin 
420 425 430 

Ser His Gin Asn Asn Phe Glu Trp He Ser Phe Lys Thr Asn Ala Asn 
435 440 445 

Ala Met Val Ser Thr Leu Ala Gly Arg Thr Ser Ala Leu Arg Ala Leu 
450 455 460 

Pro Leu Glu Val He Thr Asn Ala Phe Gin He Ser Leu Glu Glu Ala 
465 470 475 480 

Arg Arg He Lys Phe Asn Thr Leu Glu Thr Thr Leu Thr Arg Ala Arg 
485 490 495 

Gly Gly Gin Pro Gin Leu He Glu Glu He Val Glu Ala 
50*0 505 
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<210> 19 
<211> 1488 
<212> DNA 
<213> Glycine max 

<220> 

<221> CDS 

<222> (1) . . (1485) 

<223> Gycinin A-la-B-x subun.it 

<400> 19 

atg gcc aag eta gtt ttt tec ctt tgt ttt ctg ctt ttc agt ggc tgc 48 

Met Ala Lys Leu Val Phe Ser Leu Cys Phe Leu Leu Phe Ser Gly Cys 
1 5 10 15 

tgc ttc get ttc agt tec aga gag cag cct cag caa aac gag tgc cag 9 6 
Cys Phe Ala Phe Ser Ser Arg Glu Gin Pro Gin Gin Asn Glu Cys Gin 
20 25 30 

ate caa aaa etc aat gcc etc aaa ccg gat aac cgt ata gag tea gaa 144 
lie Gin Lys Leu Asn Ala Leu Lys Pro Asp Asn Arg lie Glu Ser Glu 
35 40 45 

gga ggg etc att gag aca tgg aac cct aac aac aag cca ttc cag tgt 192 
Gly Gly Leu lie Glu Thr Trp Asn Pro Asn Asn Lys Pro Phe Gin Cys 
50 55 60 

gcc ggt gtt gcc etc tct cgc tgc acc etc aac cgc aac gcc ctt cgt 240 
Ala Gly Val Ala Leu Ser Arg Cys Thr Leu Asn Arg Asn Ala Leu Arg 
65 70 75 80 

aga cct tec tac acc aac ggt ccc cag gaa ate tac ate caa caa ggt 288 
Arg Pro Ser Tyr Thr Asn Gly Pro Gin Glu lie Tyr lie Gin Gin Gly 
85 90 95 

aag ggt att ttt ggc atg ata tac ccg ggt tgt cct age aca ttt gaa 33 6 
Lys Gly lie Phe Gly Met He Tyr Pro Gly Cys Pro Ser Thr Phe Glu 
100 105 110 

gag cct caa caa cct caa caa aga gga caa age age aga cca caa gac 384 
Glu Pro Gin Gin Pro Gin Gin Arg Gly Gin Ser Ser Arg Pro Gin Asp 
115 120 125 

cgt cac cag aag ate tat aac ttc aga gag ggt gat ttg ate gca gtg 432 
Arg His Gin Lys He Tyr Asn Phe Arg Glu Gly Asp Leu He Ala Val 
130 135 140 

cct act ggt gtt gca tgg tgg atg tac aac aat gaa gac act cct gtt 480 
Pro Thr Gly Val Ala Trp Trp Met Tyr Asn Asn Glu Asp Thr Pro Val 
145 150 155 160 

gtt gcc gtt tct att att gac acc aac age ttg gag aac cag etc gac 528 
Val Ala Val Ser He He Asp Thr Asn Ser Leu Glu Asn Gin Leu Asp 
165 170 175 

cag atg cct agg aga ttc tat ctt get ggg aac caa gag caa gag ttt 576 
Gin Met Pro Arg Arg Phe Tyr Leu Ala Gly Asn Gin Glu Gin Glu Phe 
180 185 190 

eta aaa tat cag caa gag caa gga ggt cat caa age cag aaa gga aag 624 
Leu Lys Tyr Gin Gin Glu Gin Gly Gly His Gin Ser Gin Lys Gly Lys 
195 200 205 

cat cag caa gaa gaa gaa aac gaa gga ggc age ata ttg agt ggc ttc 672 
His- Gin Gin Glu Glu Glu Asn Glu Gly Gly Ser He Leu Ser Gly Phe 
210 215 220 
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acc ctg gaa ttc ttg gaa cat gca ttc age gtg gac aag cag ata gcg 720 
Thr Leu Glu Phe Leu Glu His Ala Phe Ser Val Asp Lys Gin lie Ala 
225 230 235 ~ 240 

aaa aac eta caa gga gag aac gaa ggg gaa gac aag gga gee att gtg 768 
Lys Asn Leu Gin Gly Glu Asn Glu Gly Glu Asp Lys Gly Ala ' lie Val 
245 250 ' 255 

aca gtg aaa gga ggt ctg age gtg ata aaa cca ccc acg gac gag cag 816 
Thr Val Lys Gly Gly Leu Ser Val lie Lys Pro Pro Thr Asp Glu Gin 
260 265 270 

caa caa aga ccc cag gaa gag gaa gaa gaa gaa gag gat gag aag cca 864 
Gin Gin Arg Pro Gin Glu Glu Glu Glu Glu Glu Glu Asp Glu Lys Pro 
275 280 285 

cag tgc aag ggt aaa gac aaa cac tgc caa cgc ccc cga gga age caa 912 
Gin Cys Lys Gly Lys Asp Lys His Cys Gin Arg Pro Arg Gly Ser Gin 
290 295 300 

age aaa age aga aga aat ggc att gac gag acc ata tgc acc atg aga 960 
Ser Lys Ser Arg Arg Asn Gly He Asp Glu Thr He Cys Thr Met Arg 
305 310 315 320 

ctt cgc cac aac att ggc cag act tea tea cct gac ate tac aac cct 1008 
Leu Arg His Asn He Gly Gin Thr Ser Ser Pro Asp He Tyr Asn Pro 
325 330 335 

caa gee ggt age gtc aca acc gec acc age ctt gac ttc cca gec etc 1056 
Gin Ala Gly Ser Val Thr Thr Ala Thr Ser Leu Asp Phe Pro Ala Leu 
340 345 350 

• teg tgg etc aga .etc agt get gag ttt gga tct etc cgc aag aat gca 1104 
Ser Trp Leu Arg Leu Ser Ala Glu Phe . Gly Ser Leu Arg Lys Asn Ala 
355 360 365 

atg ttc gtg cca cac tac aac ctg aac gcg aac age ata ata tac gca 1152 
Met Phe Val Pro His Tyr Asn Leu Asn Ala Asn Ser He He Tyr Ala 
370 375 380 

ttg aat gga egg gca ttg ata caa gtg gtg aat tgc aac ggt gag aga 1200 
Leu Asn Gly Arg Ala Leu He Gin Val Val Asn Cys Asn Gly Glu Arg 
385 390 395 " 400 

gtg ttt gat gga gag ctg caa gag gga egg gtg ctg ate gtg cca caa 1248 
Val Phe Asp Gly Glu Leu Gin Glu Gly Arg Val Leu He Val Pro Gin 

405 410 415 

aac ttt gtg gtg get gca aga tea cag agt gac aac ttc gag tat gtg 1296 
Asn Phe Val Val Ala Ala Arg Ser Gin Ser Asp Asn Phe Glu Tyr Val 
420 425 " 430 

tea ttc aag acc aat gat aca ccc atg ate ggc act ctt gca ggg gca 1344 
Ser Phe Lys Thr Asn Asp Thr Pro Met He Gly Thr Leu Ala Gly Ala 
435 440 445 

aac tea ttg ttg aac gca tta cca gag gaa gtg att cag cac act ttc 1392 
Asn Ser Leu Leu Asn Ala Leu Pro Glu Glu Val He Gin His Thr Phe 
450 455 460 

aac eta aaa age cag cag gee agg cag ata aag aac aac aac cct ttc 1440 
Asn Leu Lys Ser Gin Gin Ala Arg Gin He Lys Asn Asn Asn Pro Phe 
465 470 475 480 

aag ttc ctg gtt cca cct cag gag tct cag aag aga get gtg get tag 1488 
Lys Phe Leu Val Pro Pro Gin Glu Ser Gin Lys Arg Ala Val Ala 
485 490 " 495 
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<210> 20 
<211> 495 
<212> PRT 
<213> Glycine max 

<400> 20 

Met Ala Lys Leu Val Phe Ser Leu Cys Phe Leu Leu Phe Ser Gly Cys 
15 10 15 

Cys Phe Ala Phe Ser Ser Arg Glu Gin Pro Gin Gin Asn Glu Cys Gin 
20 25 30 

lie Gin Lys Leu Asn Ala Leu Lys Pro Asp Asn Arg He Glu Ser Glu 
35 40 45 

Gly Gly Leu He Glu' Thr Trp Asn Pro Asn Asn Lys Pro Phe Gin Cys 
50 55 60 

Ala Gly Val Ala Leu Ser Arg Cys Thr Leu Asn Arg Asn Ala Leu Arg 
65 70 75 - 80 

Arg Pro Ser Tyr Thr Asn Gly Pro Gin Glu He Tyr He Gin Gin Gly 
85 90 '95 

Lys Gly lie Phe Gly Met He Tyr Pro Gly Cys Pro Ser Thr Phe Glu 
100 105 110 

Glu Pro Gin Gin Pro Gin Gin Arg Gly Gin Ser Ser Arg Pro Gin Asp 
115 120 125 

Arg His Gin Lys He Tyr* Asn Phe Arg Glu Gly Asp Leu He Ala Val 
130 135 140 

Pro Thr Gly Val Ala Trp Trp Met Tyr Asn Asn Glu Asp Thr Pro Val 
145 150 155 160 

Val Ala Val Ser He He Asp Thr Asn Ser Leu Glu Asn Gin Leu Asp 
165 170 175 

Gin Met Pro Arg Arg Phe Tyr Leu Ala Gly Asn Gin Glu Gin Glu Phe 
180 185 190 

Leu Lys Tyr Gin Gin Glu Gin Gly Gly His Gin Ser Gin Lys Gly Lys 
195 200 205 

His Gin Gin Glu Glu Glu Asn Glu Gly Gly Ser He Leu Ser Gly Phe 
210 215 220 

Thr Leu Glu Phe Leu Glu His Ala Phe Ser Val Asp Lys Gin He Ala 
225 230 235 240 

Lys Asn Leu Gin Gly Glu Asn Glu Gly Glu Asp Lys Gly Ala He Val 
245 250 255 

Thr Val Lys Gly Gly Leu Ser Val He Lys Pro Pro Thr Asp Glu Gin 
260 265 270 

Gin Gin Arg Pro Gin Glu Glu Glu Glu Glu Glu Glu Asp Glu Lys Pro 
275 280 285 

Gin Cys Lys Gly Lys Asp Lys His Cys Gin Arg Pro Arg Gly Ser Gin 
290 295 300 

Ser Lys Ser Arg Arg Asn Gly He Asp Glu Thr He Cys Thr Met Arg 
305 310 315 320 

Leu Arg His Asn He Gly Gin Thr Ser Ser Pro Asp He Tyr Asn Pro 
325 330 ' 335 

Gin Ala Gly Ser Val Thr Thr Ala Thr Ser Leu Asp Phe Pro Ala Leu 
340 345 350 
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Ser Trp Leu Arg Leu Ser Ala Glu Phe Gly Ser Leu Arg Lys Asn Ala 
355 360 365 

Met Phe Val Pro His Tyr Asn Leu Asn Ala Asn Ser lie lie Tyr Ala 
370 375 380 

Leu Asn Gly Arg Ala Leu He Gin Val Val Asn Cys Asn Gly Glu Arg 
385 390 395 * 400 

Val Phe Asp Gly Glu Leu Gin Glu Gly Arg Val Leu He Val Pro Gin 
405 410 415 

Asn Phe Val Val Ala Ala Arg Ser Gin Ser Asp Asn Phe Glu Tyr Val 
420 425 430 

Ser Phe Lys Thr Asn Asp Thr Pro Met He Gly Thr Leu Ala Gly Ala 
. 435 440 445 

Asn Ser Leu Leu Asn Ala Leu Pro Glu Glu Val He Gin His Thr Phe 
450 455 460. 

Asn Leu Lys Ser Gin Gin Ala Arg Gin He Lys Asn Asn Asn Pro Phe 
465 470 475 . 480 

Lys Phe Leu Val Pro Pro Gin Glu Ser Gin Lys Arg Ala Val Ala 
485 490 495 



<210> 21 
<211> 1458 
<212> DNA 
<213> Glycine max 

<220> 

<221> CDS 

<222> (1) . . (1455) 

<223> glycinin G2 subunit 

<400> 21 

atg gcc aag ctt gtt ctt tec ctt tgt ttc ctt ctt ttc agt ggc tgc 48 
Met Ala Lys Leu Val Leu Ser Leu Cys Phe Leu Leu Phe Ser Gly Cys 
1 5 10 15 

ttc get ctg aga gag cag gca cag caa aat gag tgc cag ate caa aag 96 
Phe Ala Leu Arg Glu Gin Ala Gin Gin Asn Glu Cys Gin He Gin Lys 
20 25 30 

ctg aat gcc etc aaa ccg gat aac cgt ata gag teg gaa ggt ggg ttc 144 
Leu Asn Ala Leu Lys Pro Asp Asn Arg He Glu Ser Glu Gly Gly Phe 
35 40 45 

att gag aca tgg aac cct aac aac aag cca ttc cag tgt gcc ggt gtt 192 
He Glu Thr Trp Asn Pro Asn Asn Lys Pro Phe Gin Cys Ala Gly Val 
50 55 60 

gcc etc tct cgc tgc acc ctt aac cgc aat gcc ctt cgt aga cct tec 240 
Ala Leu Ser Arg Cys Thr Leu Asn Arg Asn Ala Leu Arg Arg Pro Ser 
65 70 75 ~ 80 

tac acc aac ggt ccc cag gaa ate tac ata caa caa ggt aat ggt att 288 
Tyr Thr Asn Gly Pro Gin Glu He Tyr He Gin Gin Gly Asn Gly He 
85 90 95 

ttt ggc atg ata ttc ccg ggt tgt cct age act tat caa gag ccg caa 336 
Phe Gly Met He Phe Pro Gly Cys Pro Ser Thr Tyr Gin Glu Pro Gin 
100 105 ~ no 
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gaa tct cag caa cga gga cga age cag agg ccc caa gac cgt cac caa 384 
Glu Ser Gin Gin Arg Gly Arg Ser Gin Arg Pro Gin Asp Arg His Gin 
115 120 125 

aag gta cat cgc ttc aga gag ggt gat ttg ate gca gtg cct act ggt 432 
Lys Val His Arg Phe Arg Glu Gly Asp Leu lie Ala Val Pro Thr Gly 
130 135 140 

gtt gca tgg tgg atg tac aac aat gaa gac act cct gtt gtt gee gtt 480 
Val Ala Trp Trp Met Tyr Asn Asn Glu Asp Thr Pro Val Val Ala Val 
145 " 150 155 160 

tct att att gac acc aac age ttg gag aac cag etc gac cag atg cct 528 
Ser lie lie Asp Thr Asn Ser Leu Glu Asn Gin Leu Asp Gin Met Pro 
165 170 175 

agg aga ttc tat ctt get ggg aac caa gag caa gag ttt eta aaa tat 576 
Arg Arg Phe Tyr Leu Ala Gly Asn Gin Glu Gin Glu Phe Leu Lys Tyr 
180 185 190 

cag cag cag cag caa gga ggt tec caa age cag aaa gga aag caa caa 624 
Gin Gin Gin Gin Gin Gly Gly Ser Gin Ser Gin Lys Gly Lys Gin Gin 
195 200 205 

gaa gaa gaa aac gaa gga age aac ata ttg agt ggc ttc gec cct gaa 672 
Glu Glu Glu Asn Glu Gly Ser Asn lie Leu Ser Gly Phe Ala Pro Glu 
210 215 220 

ttc ttg aaa gaa gcg ttc ggc gtg aac atg cag ata gtg aga aac eta 720 
Phe Leu Lys Glu Ala Phe Gly Val Asn Met Gin lie Val Arg Asn Leu 
225 230 235 240 

caa ggt gag aac gaa gag gag gat agt gga gec att gtg aca gtg aaa 768 
Gin Gly Glu Asn Glu Glu Glu Asp Ser Gly Ala He Val Thr Val Lys 
245 250 255' 

gga ggt eta aga gtc aca get cca gee atg agg aag cca cag caa gaa 816 
Gly Gly Leu Arg Val Thr Ala Pro Ala Met Arg Lys Pro Gin Gin Glu 
260 265 270 

gaa gat gat gat gat gag gaa gag cag cca cag tgc gtg gag aca gac 864 
Glu Asp Asp Asp Asp Glu Glu Glu Gin Pro Gin Cys Val Glu Thr Asp 
275 280 285 

aaa ggt tgc caa cgc caa age aaa agg age aga aat ggc att gat gag 912 
Lys Gly Cys Gin Arg Gin Ser Lys Arg Ser Arg Asn Gly He Asp Glu • 
290 295 300 

acc att tgc aca atg aga ctt cgc caa aac att ggt cag aat tea tea 960 
Thr lie Cys Thr Met Arg Leu. Arg Gin Asn He Gly Gin Asn Ser Ser 
305 ~ 310 315 320 

cct gac ate tac aac cct caa get ggt age ate aca acc gee acc age 1008 
Pro Asp lie Tyr Asn Pro Gin Ala Gly Ser He Thr Thr Ala Thr Ser 
325 330 335 

ctt gac ttc cca gee etc tgg ctt etc aaa etc agt gec cag tat gga 1056 
Leu Asp Phe Pro Ala Leu Trp Leu Leu Lys Leu Ser Ala Gin Tyr Gly 
340 345 350 

tea etc cgc aag aat get atg ttc gtg cca cac tac acc ctg aac gcg 1104 
Ser Leu Arg Lys Asn Ala Met Phe Val Pro His Tyr Thr Leu Asn Ala 
355 360 365 

aac age ata ata tac gca ttg aat ggg egg gca ttg gta caa gtg gtg 1152 
Asn Ser He He Tyr Ala Leu Asn Gly Arg Ala Leu Val Gin Val Val 
370 375 380 
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aat tgc aat ggt gag aga gtg ttt gat gga gag ctg caa gag gga ggg 1200 
Asn Cys Asn Gly Glu Arg Val Phe Asp Gly Glu Leu Gin Glu Gly Gly 
385 390 395 400 

gtg ctg ate gtt cca caa aac ttt gcg gtg get gca aaa tec cag age 1248 
Val Leu lie Val Pro Gin Asn Phe Ala Val Ala Ala Lys Ser Gin Ser 
405 410 415 

gat aac ttt gag tat gtg tea ttc aag acc aat gat aga ccc teg ate 1296 
Asp Asn Phe Glu Tyr Val Ser Phe Lys Thr Asn Asp Arg Pro Ser lie 
420 425 430 

gga aac ctt gca ggg gca aac tea ttg ttg aac gca ttg cca gag gaa 1344 
Gly Asn Leu Ala Gly Ala Asn Ser Leu Leu Asn Ala Leu Pro Glu Glu 
435 440 445 

gtg att cag cac act ttt aac eta aag age cag cag gec agg cag gtg 1392 
Val lie Gin His Thr Phe Asn Leu Lys Ser Gin Gin Ala Arg Gin Val 
450 455 460 

aag aac aac aac cct ttc age ttc ctt gtt cca cct cag gag tct cag 1440 
Lys .Asn Asn Asn Pro Phe Ser Phe Leu Val Pro Pro Gin Glu Ser Gin 
465 . 470 475 480 

agg aga get gtg get tag 1458 
Arg Arg Ala Val Ala 
485 

<210> 22 

<211> 485 

<212> PRT 

<213> Glycine max 

<400> 22 

Met Ala Lys Leu Val Leu Ser Leu Cys Phe Leu Leu Phe Ser Gly Cys 
15 10 15 

Phe Ala Leu Arg Glu Gin Ala Gin Gin Asn Glu Cys Gin lie Gin Lys 
20 25 30 

Leu Asn Ala Leu Lys Pro Asp Asn Arg lie Glu Ser Glu Gly Gly Phe 
35 40 45 

lie Glu Thr Trp Asn Pro Asn Asn Lys Pro Phe Gin Cys Ala Gly Val 
50 55 60 

Ala Leu Ser Arg Cys Thr Leu Asn Arg Asn Ala Leu Arg Arg Pro Ser 
65 70 75 80 

Tyr Thr Asn Gly Pro Gin Glu lie Tyr lie Gin Gin Gly Asn Gly lie 
85 90 95 

Phe Gly Met lie Phe Pro Gly Cys Pro Ser Thr Tyr Gin Glu Pro Gin 
100 105 110 

Glu Ser Gin Gin Arg Gly Arg Ser Gin Arg Pro Gin Asp Arg His Gin 
115 120 125 

Lys Val His Arg Phe Arg Glu Gly Asp Leu He Ala Val Pro Thr Gly 
130 135 140 

Val Ala Trp Trp Met Tyr Asn Asn Glu Asp Thr Pro Val Val Ala Val 
145 " 150 155 160 

Ser He He Asp Thr Asn Ser Leu Glu Asn Gin Leu Asp Gin Met Pro 
165 170 175 

Arg Arg Phe Tyr Leu Ala Gly Asn Gin Glu Gin Glu Phe Leu Lys Tyr 
180 185 190 
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Gin Gin Gin Gin Gin Gly Gly Ser Gin Ser Gin Lys Gly Lys Gin Gin 
195 200 205 

Glu Glu Glu Asn Glu Gly Ser Asn lie Leu Ser Gly Phe Ala Pro Glu 
210 215 220 

Phe Leu Lys Glu Ala Phe Gly Val Asn Met Gin lie Val Arg Asn Leu 
225 230 235 240 

Gin Gly Glu Asn Glu Glu Glu Asp Ser Gly Ala lie Val Thr Val Lys 
245 . 250 255 

Gly Gly Leu Arg Val Thr Ala Pro Ala Met Arg Lys Pro Gin Gin Glu 
260 265 270 

Glu Asp Asp Asp Asp Glu Glu Glu Gin Pro Gin Cys Val Glu Thr Asp 
275 280 285 

Lys Gly Cys Gin Arg Gin Ser Lys Arg Ser Arg Asn Gly He Asp Glu 
290 295 300 

Thr He Cys Thr Met Arg Leu Arg Gin Asn He Gly Gin Asn Ser Ser 
305 " 310 315 320 

Pro Asp He Tyr Asn Pro Gin Ala Gly Ser He Thr Thr Ala Thr Ser 
325 330 335 

Leu Asp Phe Pro Ala Leu Trp Leu Leu Lys Leu Ser Ala Gin Tyr Gly 
340 345 350 

Ser Leu Arg Lys Asn Ala Met Phe Val Pro His Tyr Thr Leu Asn Ala 
355 360 365 

Asn Ser He He Tyr Ala Leu Asn Gly Arg Ala Leu Val Gin Val Val 

370 375 380 

Asn Cys Asn Gly Glu Arg Val Phe Asp Gly Glu Leu Gin Glu Gly Gly 
385 390 395 400 

Val Leu He Val Pro Gin Asn Phe Ala Val Ala Ala Lys Ser Gin Ser 
405 410 415 

Asp Asn Phe Glu Tyr Val Ser Phe Lys Thr Asn Asp Arg Pro Ser lie 
420 425 430 

Gly Asn Leu Ala Gly Ala Asn Ser Leu Leu Asn Ala Leu Pro Glu Glu 
435 440 445 

Val He Gin His Thr Phe Asn Leu Lys Ser Gin Gin Ala Arg Gin Val 
450 455 460 

Lys Asn Asn Asn Pro Phe Ser Phe Leu Val Pro Pro Gin Glu Ser Gin 
465 470 475 480 

Arg Arg Ala Val Ala 
485 



<210> 23 
<211> 1689 
<212> DNA 
<213> Glycine max 

<220> 

<221> CDS 

<222> (1) . . (1686) 

<223> glycinin A5A4B3 subunits 

<400> 23 

atg ggg aag ccc ttc act etc tct ctt tct tec ctt tgc ttg eta etc 48 
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Met Gly Lys Pro Phe Thr Leu Ser Leu Ser Ser Leu Cys Leu Leu Leu 
1 5 10 15 

ttg teg agt gca tgc ttt get att age tec age aag etc aac gag tgc 96 
Leu Ser Ser Ala Cys Phe Ala lie Ser Ser Ser Lys Leu Asn Glu Cys 
20 25 30 

caa etc aac aac etc aac gcg ttg gaa ccc gac cac cgc gtt gag tec 144 
Gin Leu Asn Asn Leu Asn Ala Leu Glu Pro Asp His Arg Val Glu Ser 
35 40 45 

gaa ggt ggt ttg att caa aca tgg aac tct caa cac cct gag ctg aaa 192 
Glu Gly Gly Leu lie Gin Thr Tip Asn Ser Gin His Pro Glu Leu Lys 
50 55. 60 

tgc gee ggt gtc act gtt tec aaa etc acc etc aac cgc aat ggc etc 240 
Cys Ala Gly Val Thr Val Ser Lys Leu Thr Leu Asn Arg Asn Gly Leu 
65 70 75 80 

cac teg cca tct tac tea cct tat ccc egg atg ate ate ate gec caa 288 
His Ser Pro Ser Tyr Ser Pro Tyr Pro Arg Met He He He Ala Gin 
85 90 95 

ggg aaa gga gca ctt gga gtt gca att cca gga tgt cct gag acg ttt 336 
Gly Lys Gly Ala Leu Gly Val Ala He Pro Gly Cys Pro Glu Thr Phe 
100 105 HO 

gag gag cca caa gaa caa tea aac aga aga ggc tea agg teg cag aag 384 
Glu Glu Pro Gin Glu Gin Ser Asn Arg Arg Gly Ser Arg Ser Gin Lys 
115 120 125 

cag cag eta cag gac agt cac cag aag att cgt cac ttc aat gaa gga 432 
Gin Gin Leu Gin Asp Ser His Gin Lys He Arg His Phe Asn Glu Gly 
130 135 140 

gac gta etc gtg att cct cct agt gtt cct tac tgg acc tat aac act 480 
Asp Val Leu Val He Pro Pro Ser Val Pro Tyr Trp Thr Tyr Asn Thr 
145 150 .155 " 160 

ggc gat gaa cca gtt gtt gee ate agt ctt ctt gac acc tct aac ttc 528 
Gly Asp Glu Pro Val Val Ala He Ser Leu Leu Asp Thr Ser Asn Phe 
165 170 175 

aat aac cag ctt gat caa acc cct agg gta ttt tac ctt get ggg aac 576 
Asn Asn Gin Leu Asp Gin Thr Pro Arg Val Phe Tyr Leu Ala Gly Asn' 
180 185 190 

cca gat ata gag tac cca gag acc atg caa caa caa caa cag cag aaa 624 
Pro Asp He Glu Tyr Pro Glu Thr Met Gin Gin Gin Gin Gin Gin Lys 
195 200 205 

agt cat ggt gga cgc aag cag ggg caa cac cag cag gag gaa gag gaa 672 
Ser His Gly Gly Arg Lys Gin Gly Gin His Gin Gin Glu Glu Glu Glu 
210 215 220 

gaa ggt ggc age gtg etc agt ggc ttc age aaa cac ttc ttg gca caa 720 
Glu Gly Gly Ser Val Leu Ser Gly Phe Ser Lys His Phe Leu Ala Gin 
225 230 235 240 

tec ttc aac acc aac gag gac ata get gag aaa ctt gag tct cca gac 768 
Ser Phe Asn Thr Asn Glu Asp He Ala Glu Lys Leu Glu Ser Pro Asp 
245 250 255 

gac gaa agg aag cag ate gtg aca gtg gaa gga ggt etc age gtt ate 816 
Asp Glu Arg Lys Gin He Val Thr Val Glu Gly Gly Leu Ser Val He 
260 265 270 
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age ccc aag tgg caa gaa caa caa gat gaa gat gaa gat gaa gac gaa 864 
Ser Pro Lys Trp Gin Glu Gin Gin Asp Glu Asp Glu Asp Glu Asp Glu 
275 280 285 

gat gat gaa gat gaa caa att ccc tct cac cct cct cgc cga cca age 912 
Asp Asp Glu Asp Glu Gin lie Pro Ser His Pro Pro Arg Arg Pro Ser 
290 295 300 

cat gga aag cgt gaa caa gac gag gac gag gac gaa gat gaa gat aaa 960 
His Gly Lys Arg Glu Gin Asp Glu Asp Glu Asp Glu Asp Glu Asp Lys 
305 310 315 320 

cct cgt cct agt cga cca age caa gga aag egg aac aag aca gga cag 1008 
Pro Arg Pro Ser Arg Pro Ser Gin Gly Lys Arg Asn Lys Thr Gly Gin 
325 330 335 • 

gac gag gac gaa gat gaa gat gaa gat caa cct cgc aag age cgc gaa 1056 
Asp Glu Asp Glu Asp Glu Asp Glu Asp Gin Pro Arg Lys Ser Arg Glu 
340 345 350 

tgg aga teg aaa aag aca caa ccc aga aga cct aga caa gaa gaa cca 1104 
Trp Arg Ser Lys Lys Thr Gin Pro Arg Arg Pro Arg Gin Glu Glu Pro 
355 360 365 

cgt gaa aga gga tgc gag aca aga aac ggg gtt gag gaa aat ate tgc 1152 
Arg Glu Arg Gly Cys Glu Thr Arg Asn Gly Val Glu Glu Asn lie Cys 
370 375 380 

acc ttg aag ctt cac gag aac att get cgc cct tea cgc get gac ttc 1200 
Thr Leu Lys Leu His Glu Asn He Ala Arg Pro Ser Arg Ala Asp Phe 
385 390. 395 400 

tac aac cct aaa get ggt cgc att agt acc etc aac age etc acc etc 1248 
Tyr Asn Pro Lys Ala Gly Arg He Ser Thr Leu Asn Ser Leu Thr Leu 
405 410 415 

cca gec etc cgc caa ttc caa etc agt gee caa tat gtt gtc etc tac 1296 
Pro Ala Leu Arg Gin Phe Gin Leu Ser Ala Gin Tyr Val Val Leu Tyr 
420 425 430 

aag aat gga att tac tct cca cat tgg aat ctg aat gca aac agt gtg 1344 
Lys Asn Gly He Tyr Ser Pro His Trp Asn Leu Asn Ala Asn Ser Val 
435 440 445 

ate tat gtg act cga gga caa gga aag gtt aga gtt gtg aac tgc. caa . 1392 
He Tyr Val Thr Arg Gly Gin Gly Lys Val Arg Val Val Asn Cys Gin 
450 455 460 

ggg aat gca gtg ttc gac ggt gag ctt agg agg gga caa ttg ctg gtg 1440 
Gly Asn Ala Val Phe Asp Gly Glu Leu Arg Arg Gly Gin Leu Leu Val 
465 470 475 480 

gta cca cag aac ttc gtg gtg gcg gag caa gee gga gaa caa gga ttc 1488 
Val Pro Gin Asn Phe Val Val Ala Glu Gin Ala Gly Glu Gin Gly Phe 
485 490 495 

gaa tac ata gta ttc aag aca cac cac aac gca gtc act age tac ttg 1536 
Glu Tyr He Val Phe Lys Thr His His Asn Ala Val Thr Ser Tyr Leu 
500 505 510 

aag gat gtg ttt agg gca att ccc tea gag gtt ctt gee cat tct tac 1584 
Lys Asp Val Phe Arg Ala He Pro Ser Glu Val Leu Ala His Ser Tyr 
515 520 525 

aac ctt cga cag agt caa gtg tct gag ctt aag tat gaa gga aat tgg 1632 
Asn Leu Arg Gin Ser Gin Val Ser Glu Leu Lys Tyr Glu Gly Asn Trp 
530 535 540 
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ggt cct ttg gtc aac cct gag tct caa caa ggc tea ccc cgt gtt aaa 1680 
Gly Pro Leu Val Asn Pro Glu Ser Gin Gin Gly Ser Pro Arg Val Lys 
545 550 555 560 

gtc gca taa 1689 
Val Ala 

<210> 24 

<211> 562 

<212> PRT 

<213> Glycine max 

<400> 24 

Met Gly Lys Pro Phe Thr Leu Ser Leu Ser Ser Leu Cys Leu Leu Leu 
15 10 15 

Leu Ser Ser Ala Cys Phe Ala lie Ser Ser Ser Lys Leu Asn Glu Cys 
20 25 30 

Gin Leu Asn Asn Leu Asn Ala Leu Glu Pro Asp His Arg Val Glu Ser 
35 40 45 

Glu Gly Gly Leu lie Gin Thr Trp Asn Ser Gin His Pro Glu Leu Lys 
50 ' 55 60 

Cys Ala Gly Val Thr Val Ser Lys Leu Thr Leu Asn Arg Asn Gly Leu 
65 70 75 80 

His Ser Pro Ser Tyr Ser Pro Tyr Pro. Arg Met lie lie lie Ala Gin 
85 90 95 

Gly Lys Gly Ala Leu Gly Val Ala lie Pro Gly Cys Pro Glu Thr Phe 
100 105 110 

Glu Glu Pro Gin Glu Gin Ser Asn Arg Arg Gly Ser Arg Ser Gin Lys 
115 ' 120 125 

Gin Gin Leu Gin Asp Ser His Gin Lys lie Arg His Phe Asn Glu Gly 
130 135 140 

Asp Val Leu Val lie Pro Pro Ser Val Pro Tyr Trp Thr Tyr Asn Thr 
145 150 155 160 

Gly Asp Glu Pro Val Val Ala He Ser Leu Leu Asp Thr Ser Asn Phe 
165 170 175 

Asn Asn Gin Leu Asp Gin Thr Pro Arg Val Phe Tyr Leu Ala Gly Asn 
180 185 190 

Pro Asp He Glu Tyr Pro Glu Thr Met Gin Gin Gin Gin Gin Gin Lys 
195 200 205 

Ser His Gly Gly Arg Lys Gin Gly Gin His Gin Gin Glu Glu Glu Glu 
210 215 220 

Glu Gly Gly Ser Val Leu Ser Gly Phe Ser Lys His Phe Leu Ala Gin 
225 230 235 240 

Ser Phe Asn Thr Asn Glu Asp He Ala Glu Lys Leu Glu Ser Pro Asp 
245 250 255 

Asp Glu Arg Lys Gin He Val Thr Val Glu Gly Gly Leu Ser Val He 
260 265 270 

Ser Pro Lys Trp Gin Glu Gin Gin Asp Glu Asp Glu Asp Glu Asp Glu 
275 280 285 

Asp Asp Glu Asp Glu Gin He Pro Ser His Pro Pro Arg Arg Pro Ser - 
290 295 300 
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His Gly Lys Arg Glu Gin Asp Glu Asp Glu Asp Glu Asp Glu Asp Lys 
305 310 315 320 

Pro Arg Pro Ser Arg Pro Ser Gin Gly Lys Arg Asn Lys Thr Gly Gin 
325 330 335 

Asp Glu Asp Glu Asp Glu Asp Glu Asp Gin Pro Arg Lys Ser Arg Glu 
340 345 350 

Trp Arg Ser Lys Lys Thr Gin Pro Arg Arg Pro Arg Gin Glu Glu Pro 
355 360 365 

Arg Glu Arg Gly Cys Glu Thr Arg Asn Gly Val Glu Glu Asn lie Cys 
370 375 380 

Thr Leii Lys Leu His Glu Asn lie Ala Arg Pro Ser Arg Ala Asp Phe 
385 390 395 400 

Tyr Asn Pro Lys Ala Gly Arg lie Ser Thr Leu Asn Ser Leu Thr Leu 
405 410 415 

Pro Ala Leu Arg Gin Phe Gin Leu Ser Ala Gin Tyr Val Val Leu Tyr 
420 425 430 

Lys Asn Gly lie Tyr Ser Pro His Trp Asn Leu Asn Ala Asn Ser Val 
435 440 445 

lie Tyr Val Thr Arg Gly Gin Gly Lys Val Arg Val Val Asn Cys Gin 
450 455 460 

Gly Asn Ala Val Phe Asp Gly Glu Leu Arg Arg Gly Gin Leu Leu Val 
465 470 475 480 

Val Pro Gin Asn Phe Val Val Ala Glu Gin Ala Gly Glu Gin Gly Phe 
485 490 495 

Glu Tyr He Val Phe Lys Thr His His Asn Ala Val Thr Ser Tyr Leu 
500 505 510 

Lys Asp Val Phe Arg Ala He Pro Ser Glu Val Leu Ala His Ser Tyr 
515 520 525 

Asn Leu Arg Gin Ser Gin Val Ser Glu Leu Lys Tyr Glu Gly Asn Trp 
530 535 540 

Gly Pro Leu Val Asn Pro Glu Ser Gin Gin Gly Ser Pro Arg Val Lys 
545 550 555 560 

Val Ala 



<210> 25 

<211> 1551 

<212> DNA 

<213> Glycine max 

<220> 

<221> CDS 

<222> (1)..(1548) 

<223> glycinin A3-B4 subunit 

<400> 25 

atg ggg aag ccc ttc ttc act etc tct ctt tct tec ctt tgc ttg eta 48 

Met Gly Lys Pro Phe Phe Thr Leu Ser Leu Ser Ser Leu Cys Leu Leu 

15 10 15 

etc ttg teg agt gca tgc ttt get att ace tec age aag ttc aac gag 96. 
Leu Leu Ser Ser Ala Cys Phe Ala He Thr Ser Ser Lys Phe Asn Glu 
20 25 30 
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tgc caa etc aac aac etc aac gcg ttg gaa ccc gac cac cgc gtt gag 144 
Cys Gin Leu Asn Asn Leu Asn Ala Leu Glu Pro Asp His Arg Val Glu 
35 40 45 

tec gaa ggt ggt ctt att gaa aca tgg aac tct caa cac cct gag ctg 192 
Ser Glu Gly Gly Leu lie Glu Thr Trp Asn Ser Gin His Pro Glu Leu 
50 55 60 

caa tgc gee ggt gtc act gtt tec aaa cgc acc etc aac cgc aac ggc 240 
Gin Cys Ala Gly Val Thr Val Ser Lys Arg Thr Leu Asn Arg Asn Gly 
65 70 75 80 

tec cac ttg cca tct tac tta cct tat ccc caa atg ate att gtc gtt 288 
Ser His Leu Pro Ser Tyr Leu Pro Tyr Pro Gin Met lie lie Val Val 
85 90 95 

caa ggg aag gga gca att gga ttt gca ttt ccg gga tgt ccc gag acg 336 
Gin Gly Lys Gly Ala lie Gly Phe Ala Phe Pro Gly Cys Pro Glu Thr 
" 100 105 110 

ttt gag aag cca caa caa caa tea age aga aga ggc tea agg tea cag 384 
Phe Glu Lys Pro Gin Gin Gin Ser Ser Arg Arg Gly Ser Arg Ser Gin 
115 120 125 

cag caa eta caa gac agt cac cag aag att cgt cac ttc aat gaa gga 432 
Gin Gin Leu Gin Asp Ser His Gin Lys lie Arg His Phe Asn Glu Gly 
130 135 140 

gac gta eta gtg att cct ctt ggt gtt cct tac tgg acc tat aac act 480 
Asp Val Leu Val lie Pro Leu Gly Val Pro Tyr Trp Thr Tyr Asn Thr 
145 150 155 160 

ggc gat gaa cca gtt gtt gee ate agt cct ctt gac acc tec aac ttc 528 
Gly Asp Glu Pro Val Val Ala lie Ser Pro Leu Asp Thr Ser Asn Phe 
165 170 175 

aac aat cag ctt gat caa aac ccc aga gta ttt tac ctt get ggg aac • 576 
Asn Asn Gin Leu Asp Gin Asn Pro Arg Val Phe Tyr Leu Ala Gly Asn 
180 185 190 

cca gat ata gag cat ccc gag acc atg caa caa cag cag cag cag aag 624 
Pro Asp He Glu His Pro Glu Thr Met Gin Gin Gin Gin Gin Gin Lys 
195 200 205 

agt cat ggt gga cgc aag cag ggg caa cac cga cag cag gag gaa gaa 672 
•Ser His Gly Gly Arg Lys Gin Gly Gin His Arg Gin Gin Glu Glu Glu 
210 215 220 

ggt ggc agt gtg etc agt ggc ttc age aaa cat ttc tta gca caa tec 720 
Gly Gly Ser Val Leu Ser Gly Phe Ser Lys His Phe Leu Ala Gin Ser 
225 230 235 240 

ttc aac acc aac gag gac aca get gag aaa ctt egg tct cca gat gac 768 
Phe Asn Thr Asn Glu' Asp Thr Ala Glu Lys Leu Arg Ser Pro Asp Asp 
245 250 255 

gaa agg aag cag ate gtg aca gtg gag gga ggc etc age gtt ate age 816 
Glu Arg Lys Gin He Val Thr Val Glu Gly Gly Leu Ser Val He Ser 
260 265 270 

ccc aag tgg caa gaa caa gaa gac gaa gac gaa gac gaa gac gaa gaa 864 
Pro Lys Trp Gin Glu Gin Glu Asp Glu Asp Glu Asp Glu Asp Glu Glu 
275 280 285 

tat gga egg acg ccc tct tat cct cca cga cga cca age cat gga aag 912 
Tyr Gly Arg Thr Pro Ser Tyr Pro Pro Arg Arg Pro Ser His Gly Lys 
290 295 300 
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cat gaa gat gac gag gac gag gac gaa gaa gaa gat caa cct cgt cct 960 

His Glu Asp Asp Glu Asp Glu Asp Glu Glu Glu Asp Gin Pro Arg Pro 
305 310 315 320 

gat cac cct cca cag cga cca age agg ccc gaa caa caa gaa cca cgt 1008 
Asp His Pro Pro Gin Arg Pro Ser Arg Pro Glu Gin Gin Glu Pro Arg 
325 330 335 

gga aga gga tgt cag act aga aat ggg gtt gag gaa aat att tgc acc 1056 
Gly Arg Gly Cys Gin Thr Arg Asn Gly Val Glu Glu Asn lie Cys Thr 
340 345 350 

atg aag ctt cac gag aac att get cgc cct tea cgt get gac ttc tac 1104 
Met Lys Leu His Glu Asn lie Ala Arg Pro Ser Arg Ala Asp Phe Tyr 

355 360 365 • • 

aac cca aaa get ggt cgc att age acc etc aac agt etc acc etc cca 1152 
Asn Pro Lys Ala Gly Arg lie Ser Thr Leu Asn Ser Leu Thr Leu Pro 
370 375 380 

gee etc cgc caa ttc gga etc agt gee caa tat gtt gtc etc tac agg 1200 
Ala Leu Arg Gin Phe Gly Leu Ser Ala Gin Tyr Val Val Leu Tyr Arg 
385 390 395 400 

aat gga att tac tct cca gat tgg aac ttg aac gcg aac agt gtg acg 1248 
Asn Gly lie Tyr Ser Pro Asp Trp Asn Leu Asn Ala Asn Ser Val Thr 
405 410 415 

atg act cga ggg aaa gga aga gtt aga gtg gtg aac tgc caa ggg aat 1296 
Met Thr Arg Gly Lys Gly Arg Val Arg Val Val Asn Cys Gin Gly Asn 
420 425 430 

gca gtg ttc gac ggt gag eta agg agg gga caa ttg eta gtg gtg ccg 1344 
Ala Val Phe Asp Gly Glu Leu Arg Arg Gly Gin Leu Leu Val Val Pro 
435 440 445 

cag aac ccc gcg gtg get gag caa ggg gga gaa caa gga ttg gaa tat 1392 
Gin Asn Pro Ala Val Ala Glu Gin Gly Gly Glu Gin Gly Leu Glu Tyr 
450 455 460 

gta gtg ttc aag aca cac cac aac gee gtg age age tac att aag gat 1440 
Val Val Phe Lys Thr His His Asn Ala Val Ser Ser Tyr lie Lys Asp 
465 470 475 480 

gtg ttt agg gta ate cct teg gag gtt ctt tec aat tct tac aac ctt 1488 
Val Phe Arg Val lie Pro Ser Glu Val Leu Ser Asn Ser Tyr Asn Leu ' 
485 490 495 

ggc cag agt caa gtg cgt cag etc aag tat caa gga aac tec ggc cct 1536 
Gly Gin Ser Gin Val Arg Gin Leu Lys Tyr Gin Gly Asn Ser Gly Pro 
500 505 510 

ttg gtc aac cca taa 1551 
Leu Val Asn Pro 
515 

<210> 26 

<211> 516 

<212> PRT 

<213> Glycine max 

<400> 26 

Met Gly Lys Pro Phe Phe Thr Leu Ser Leu Ser Ser Leu Cys Leu Leu 
1 5' 10 15 



Leu Leu Ser Ser Ala Cys Phe Ala lie Thr Ser Ser Lys Phe Asn Glu 
20 25 30 
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Cys Gin Leu Asn Asn Leu Asn Ala Leu Glu Pro Asp His Arg Val Glu 
35 40 45 

Ser Glu Gly Gly Leu lie Glu Thr Trp Asn Ser Gin His Pro Glu Leu 
50 55 60 

Gin Cys Ala Gly Val Thr Val Ser Lys Arg Thr Leu Asn Arg Asn Gly 
65 70 75 80 

Ser His Leu Pro Ser Tyr Leu Pro Tyr Pro Gin Met lie He Val Val 
85 90 95 

Gin Gly Lys Gly Ala He Gly Phe Ala Phe Pro Gly Cys Pro Glu Thr 
100 105 110 

Phe Glu Lys Pro Gin Gin Gin Ser Ser Arg Arg Gly Ser Arg Ser Gin 
115 120 125 

Gin Gin Leu Gin Asp Ser His Gin Lys He Arg His Phe Asn Glu Gly 
130 135 140 

Asp Val Leu Val He Pro Leu Gly Val Pro Tyr Trp Thr Tyr Asn Thr 
145 150 155 160 

Gly Asp Glu Pro Val Val. Ala lie Ser Pro Leu Asp Thr Ser- Asn. Phe 
165 170 • 175 

Asn Asn Gin Leu Asp Gin Asn Pro Arg Val Phe Tyr Leu Ala Gly Asn 
180 185- 190 

Pro Asp He Glu His Pro Glu Thr Met Gin Gin Gin Gin Gin Gin Lys 
195 200 205 

Ser His Gly Gly Arg Lys Gin Gly Gin His Arg Gin Gin Glu Glu Glu 
210 215 220 

Gly Gly Ser Val Leu Ser Gly Phe Ser Lys His Phe Leu Ala Gin Ser 
225 230 235 240 

Phe Asn Thr Asn Glu Asp Thr Ala Glu Lys Leu Arg Ser Pro Asp Asp 
245 250 255 

Glu Arg Lys Gin He Val Thr Val Glu Gly Gly Leu Ser Val He Ser 
260 265 270 

Pro Lys Trp Gin Glu Gin Glu Asp Glu Asp Glu Asp Glu Asp Glu Glu 
275 280 285 

Tyr Gly Arg Thr Pro Ser Tyr Pro Pro Arg Arg Pro Ser His Gly Lys 
290 295 300 

His Glu Asp Asp Glu Asp Glu Asp Glu Glu Glu Asp Gin Pro Arg Pro 
305 310 315 320 

Asp His Pro Pro Gin Arg Pro Ser Arg Pro Glu Gin Gin Glu Pro Arg 
325 330 335 

Gly Arg Gly Cys Gin Thr Arg Asn Gly Val Glu Glu Asn He Cys Thr 
340 345 350 

Met Lys Leu His Glu Asn He Ala Arg Pro Ser Arg Ala Asp Phe Tyr 
355 360 365 

Asn Pro Lys Ala Gly Arg He Ser Thr Leu Asn Ser Leu Thr Leu Pro 
370 375 380 

Ala Leu Arg Gin Phe Gly Leu Ser Ala Gin Tyr Val Val Leu Tyr Arg 
385 390 395 400 

Asn Gly He Tyr Ser Pro Asp Trp Asn Leu Asn Ala Asn Ser Val Thr 
405 410 415 
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Met Thr Arg Gly Lys Gly Arg Val Arg Val Val Asn Cys Gin Gly Asn 
420 425 430 

Ala Val Phe Asp Gly Glu Leu Arg Arg Gly Gin Leu Leu Val Val Pro 
435 440 445 

Gin Asn Pro Ala Val Ala Glu Gin Gly Gly Glu Gin Gly Leu Glu Tyr 
450 455 460 

Val Val Phe Lys Thr His His Asn Ala Val Ser Ser Tyr lie Lys Asp 
465 470 475 480 

Val Phe Arg Val lie Pro Ser Glu Val Leu Ser Asn Ser Tyr Asn Leu 
485 490 495 

Gly Gin Ser Gin Val Arg Gin Leu Lys Tyr Gin Gly Asn Ser Gly Pro 
500 505 510 

Leu Val Asn Pro 
515 



<210> 27 

<211> 1446 

<212> DNA 

<213> Glycine max 

<220> 

<221> CDS 

<222> (1) . . (1443) 

<223> glycinin G3 subunit 

<400> 27 

atg get aag ctt gtt ctt tec ctt tgt ttt ctg ctt ttc agt ggc tgc 48 

Met Ala Lys Leu Val Leu Ser Leu Cys Phe Leu Leu Phe Ser Gly Cys 

1.5 10 15 

tgc ttc get ttc agt ttc aga gag cag cca cag caa aac gag tgc cag 96 
Cys Phe Ala Phe Ser Phe Arg Glu Gin Pro Gin Gin Asn Glu Cys Gin 
20 25 30 

ate caa cgc etc aat gec eta aaa ccg gat aac cgt ata gag tea gaa 144 
lie Gin Arg Leu Asn Ala Leu Lys Pro Asp Asn Arg lie Glu Ser Glu 
35 40 45 

ggt ggc ttc att gag aca tgg aac cct aac aac aag cca ttc cag tgt 192 
Gly Gly Phe lie Glu Thr Trp Asn Pro Asn Asn Lys Pro Phe Gin Cys 
50 55 60 

gee ggt gtt gec etc tct cgc tgc acc etc aac cgc aac gee ctt cgc 240 
Ala Gly Val Ala Leu Ser Arg Cys Thr Leu Asn Arg Asn Ala Leu Arg 
65 70 75 80 

aga cct tec tac acc aac get ccc cag gag ate tac ate caa caa ggt 288 
Arg Pro Ser Tyr Thr Asn Ala Pro Gin Glu lie Tyr He Gin Gin Gly 
85 90 95 

agt ggt att ttt ggc atg ata ttc ccg ggt tgt cct age aca ttt gaa 336 
Ser Gly He Phe Gly Met He Phe Pro Gly Cys Pro Ser Thr Phe Glu ' 
100 105 110 

gag cct caa caa aaa gga caa age age agg ccc caa gac cgt cac cag 384 
Glu Pro Gin Gin Lys Gly Gin Ser Ser Arg Pro Gin Asp Arg His Gin 
115 120 125 

aag ate tat cac ttc aga gag ggt gat ttg att gca gtg cca acc ggt 432 
Lys He Tyr His Phe Arg Glu Gly Asp Leu He Ala Val Pro Thr Gly 
130 135 140 
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ttt gca tac tgg atg tac aac aat gaa gac act cct gtt gtt gcc gtt 480 

Phe Ala Tyr Trp Met Tyr Asn Asn Glu Asp Thr Pro Val Val Ala Val 
145 150 155 160 

tct ctt att gac acc aac age ttc cag aac cag etc gac cag atg cct 528 
Ser Leu He Asp Thr Asn Ser Phe Gin Asn Gin Leu Asp Gin Met Pro 
165 170 175 

agg aga ttc tat ctt get ggg aac caa gag caa gag ttt eta cag tat 576 
Arg Arg Phe Tyr Leu Ala Gly Asn Gin Glu Gin Glu Phe Leu Gin Tyr 
180 185 190 

cag cca cag aag cag caa gga ggt act caa age cag aaa gga aag cgt 624 
Gin Pro Gin Lys Gin Gin Gly Gly Thr Gin Ser Gin Lys Gly Lys Arg 
195 • 200 205 

cag caa gaa gaa gaa aac gaa gga ggc age ata ttg agt ggc ttc gcc 672 
Gin Gin Glu Glu Glu Asn Glu Gly Gly Ser He Leu Ser Gly Phe Ala 
210 215 220 

ccg gaa ttc ttg gaa cat gcg ttc gtc gtg gac agg cag ata gtg aga 720 
Pro Glu Phe Leu Glu His Ala Phe Val Val Asp Arg Gin He Val Arg 
225 230 235 240 

aag eta caa ggt gag aac gaa gag gaa gag aag ggt gcc att gtg aca 768 
Lys Leu Gin Gly Glu Asn Glu Glu Glu Glu Lys Gly Ala He Val Thr 
245 250 255 

gtg aaa gga ggt etc age gtg ata age cca ccc acg gaa gag cag caa 816 
Val Lys Gly Gly Leu Ser Val He Ser Pro Pro Thr Glu Glu Gin Gin* 
260 265 270 

caa aga ccc gag gaa gag gag aag cca gat tgt gac gag aaa gac aaa 864 
Gin Arg Pro Glu Glu Glu Glu Lys Pro Asp Cys Asp Glu Lys Asp Lys 
275 280 285 

cat tgc caa age caa age aga aat ggc att gac gag acc att tgc aca 912 
His Cys Gin Ser Gin Ser Arg Asn Gly He Asp Glu Thr He Cys Thr 
290 295 300 

atg aga ctt cgc cac aac att ggc cag act tea tea cct gac ate ttc 960 
Met Arg Leu Arg His Asn He Gly Gin Thr Ser Ser Pro Asp He Phe 
305 310 315 320 

aac cct caa get ggt age ate aca acc get acc age etc gac ttc cca 1008 
Asn Pro Gin Ala Gly Ser He Thr Thr Ala Thr Ser Leu Asp Phe Pro 
325 330 335 

gcc etc teg tgg etc aaa etc agt gcc cag ttt gga tea etc cgc aag 1056 
Ala Leu Ser Trp Leu Lys Leu Ser Ala Gin Phe Gly Ser Leu Arg Lys 
340 345 350 

aat get atg ttc gtg cca cac tac aac ctg aac gca aac age ata ata 1104 
Asn Ala Met Phe Val Pro His Tyr Asn Leu Asn Ala Asn Ser He He 
355 360 365 

tac gca ttg aat gga egg gca ttg gta caa gtg gtg aat tgc aat ggt 1152 
Tyr Ala Leu Asn Gly Arg Ala Leu Val Gin Val Val Asn Cys Asn Gly 
370 375 380 

gag aga gtg ttt gat gga gag ctg caa gag gga cag gtg tta att gtg 1200 
Glu Arg Val Phe Asp Gly Glu Leu Gin Glu Gly Gin Val Leu He Val 
385 390 395 400 

cca caa aac ttt gcg gtg get gca aga tea cag age gac aac ttc gag 1248 
Pro Gin Asn Phe Ala Val Ala Ala Arg Ser Gin Ser Asp Asn Phe Glu 
405 410 415 



WO 03/078629 W&eS WMf PCT/EP03/02735 

38 

tat gtt tea ttc aag acc aat gat aga ccc teg ate ggc aac ctt gca 1296 
Tyr Val Ser Phe Lys Thr Asn Asp Arg Pro Ser lie Gly Asxi Leu Ala 
420 425 430 

ggt gca aac tea ttg ttg aac gca ttg ccg gag gaa gtg att cag caa 1344 
Gly Ala Asn. Ser Leu Leu Asn Ala Leu Pro Glu Glu Val lie Gin Glh- 
435 440 445 

act ttt aac eta agg agg cag cag gec agg cag gtc aag aac aac aac 1392 
Thr Phe Asn Leu Arg Arg Gin Gin Ala Arg Gin Val Lys Asn Asn Asn 
450 455 460 

cct ttc age ttc ctg gtt cca cct aag gag tct cag agg aga gtt gtg 1440 
Pro Phe Ser Phe Leu Val Pro Pro Lys Glu Ser Gin Arg Arg Val Val 
465 470 475 480 

get tag 1446 
Ala 

<210> 28 

<211> 481 

<212> PRT 

<213> Glycine max 

<400> 28 

Met Ala Lys Leu Val Leu Ser Leu Cys Phe Leu Leu Phe Ser Gly Cys 
1 5 10 15 

Cys Phe Ala Phe Ser Phe Arg Glu Gin Pro Gin Gin Asn Glu Cys Gin 
20 25 30 

lie Gin Arg Leu Asn Ala Leu Lys Pro Asp Asn Arg lie Glu Ser Glu 
35 40 45 

Gly Gly Phe lie Glu Thr Trp Asn Pro Asn Asn Lys Pro Phe Gin Cys 
50 55 60 

Ala Gly Val Ala Leu Ser Arg Cys Thr Leu Asn Arg Asn Ala Leu Arg 
65 70 75 80 

Arg Pro Ser Tyr Thr Asn Ala Pro Gin Glu lie Tyr lie Gin Gin Gly 
85 90 95 

Ser Gly lie Phe Gly Met lie Phe Pro Gly Cys Pro Ser Thr Phe Glu 
100 105 110 

Glu Pro Gin Gin Lys Gly Gin Ser Ser Arg Pro Gin Asp Arg His Gin 
115 120 125 

Lys lie Tyr His Phe Arg Glu Gly Asp Leu lie Ala Val Pro Thr Gly 
130 135 140 

Phe Ala Tyr Trp Met Tyr Asn Asn Glu Asp Thr Pro Val Val Ala Val 
145 150 155 160 

Ser Leu lie Asp Thr Asn Ser Phe Gin Asn Gin Leu Asp Gin Met Pro 
165 170 175 

Arg Arg Phe Tyr Leu Ala Gly Asn Gin Glu Gin Glu Phe Leu Gin Tyr 
180 185 190 

Gin Pro Gin Lys Gin Gin Gly Gly Thr Gin Ser Gin Lys Gly Lys Arg 
195 200 205 

Gin Gin Glu Glu Glu Asn Glu Gly Gly Ser lie Leu Ser Gly Phe Ala 
210 215 220 

Pro Glu Phe Leu Glu His Ala Phe Val Val Asp Arg Gin lie Val Arg 
225 230 235 240 
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Lys Leu Gin Gly Glu Asn Glu Glu Glu Glu Lys Gly Ala lie Val Thr 
245 250 255 

Val Lys Gly Gly Leu Ser Val lie Ser Pro Pro Thr Glu Glu Gin Gin 
260 265 270 

Gin Arg Pro Glu Glu Glu Glu Lys Pro Asp Cys Asp Glu Lys Asp Lys 
275 280 285 

His Cys Gin Ser Gin Ser Arg Asn Gly lie Asp Glu Thr He Cys Thr 
290 295 300 

Met Arg Leu Arg His Asn He Gly Gin Thr Ser Ser Pro Asp He Phe 
305 310 315 320 

Asn Pro Gin Ala Gly Ser He Thr Thr Ala Thr Ser Leu Asp Phe Pro 
325 330 335 

Ala Leu Ser Trp Leu Lys Leu Ser Ala Gin Phe Gly Ser Leu Arg Lys 
340 345 350 

Asn Ala Met Phe Val Pro His Tyr Asn Leu Asn Ala Asn Ser He He 
355 360 365 

Tyr Ala Leu Asn Gly Arg Ala Leu Val Gin Val Val Asn Cys Asn Gly 
370 375 380 

Glu Arg Val Phe Asp Gly Glu Leu Gin Glu Gly Gin Val Leu He Val 
385 390 395 400 

Pro Gin Asn Phe Ala Val Ala Ala Arg Ser Gin Ser Asp Asn Phe Glu 
405 410 415 

Tyr Val Ser Phe Lys Thr Asn Asp Arg Pro Ser He Gly Asn Leu Ala 
420 425 430 

Gly Ala Asn Ser Leu Leu Asn Ala Leu Pro Glu Glu Val He Gin Gin 
435 440 "445 

Thr Phe Asn Leu Arg Arg Gin Gin Ala Arg Gin Val Lys Asn Asn Asn 
450 455 460 

Pro Phe Ser Phe Leu Val Pro Pro Lys Glu Ser Gin Arg Arg Val Val 
465 470 475 480 

Ala 



<210> 29 
<211> 1482 
<212> DNA 

<213> Helianthus annuus 

<220> 

<221> CDS 

<222> (1) . . (1479) 

<223> 11S storage protein G3-D1 

<400> 29 

atg gca tec aaa gca act ttg etc tta get ttt ace ctt etc ttt gec 48 

Met Ala Ser Lys Ala Thr Leu Leu Leu Ala Phe Thr Leu Leu Phe Ala 
15 10 15 

act tgc att gec cgc cac cag caa egg caa cag caa cag aac cag tgc 96 
Thr Cys He Ala Arg His Gin Gin Arg Gin Gin Gin Gin Asn Gin Cys 
20 25 30 
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cag ctt caa aac ate gag gcg etc gag ccc ate gaa gtt ate caa get 144 
Gin Leu Gin Asn lie Glu Ala Leu Glu Pro He Glu Val He Gin Ala 
35 40 45 

gaa gee ggt gtg acc gaa att tgg gac gee tat gac caa cag ttc cag 192 
Glu Ala Gly Val Thr Glu He Trp Asp Ala Tyr Asp Gin Gin Phe Gin 
50 55 60 

tgt gcg tgg teg att tta ttc gac acc gga ttc aac ctg gtg gec ttc 240 
Cys Ala Trp Ser He Leu Phe Asp Thr Gly Phe Asn Leu Val Ala Phe 
65 70 75 80 

tct tgc ctt cct acg tea aca ccc eta ttt tgg cct teg teg aga gag 288 
Ser Cys Leu Pro Thr Ser Thr Pro Leu Phe Trp Pro Ser Ser Arg Glu 
85 90 95 

ggg gtt ata ttg ccg gga tgc cgc aga acc tat gaa tat teg cag gag 336 
Gly Val He Leu Pro Gly Cys Arg Arg Thr Tyr Glu Tyr Ser Gin Glu 
100 105 " HO 

caa cag ttt tec ggt gag ggt ggc cgc aga gga gga gga gag ggc aca 384 
Gin Gin Phe Ser Gly Glu Gly Gly Arg Arg Gly Gly Gly Glu Gly Thr 
115 120 ' 125 

ttc agg acc gtc ate aga aag .tta gag aac tta aag gag ggt gac gtg 432 
Phe Arg Thr Val lie Arg Lys Leu Glu Asn Leu Lys Glu Gly Asp Val 
130 135 140 

gtt gec ate ccc acc gga aca get cac tgg ctt cac aac gac ggc aac 480 
Val Ala He Pro Thr Gly Thr Ala His Trp Leu His Asn Asp Gly Asn 
145 150 155 160 

aca gaa ctt gtg gtc gtc ttc ttg gat act cag aac cat gag aac cag 528 
Thr Glu Leu Val Val Val Phe Leu Asp Thr Gin Asn His Glu Asn Gin 
165 170 175 

ctt gac gaa aac caa agg aga ttc ttc tta gee gga aac cct caa get 576 
Leu Asp Glu Asn Gin Arg Arg Phe Phe Leu Ala Gly Asn Pro Gin Ala 
180 185 " 190 

caa get caa age cag cag caa caa caa aga caa cca cgc caa caa tct 624 
Gin Ala Gin Ser Gin Gin Gin Gin Gin Arg Gin Pro Arg Gin Gin Ser 
195 200 205 

cct caa agg caa agg caa agg caa agg caa ggg caa ggt cag aac gee 672 
Pro Gin Arg Gin Arg Gin Arg Gin Arg Gin Gly Gin Gly Gin Asn Ala 
210 215 220 

.ggc aac ate ttc aac ggt ttc acc ccc gag etc att gca caa tea ttc 720 
Gly Asn He Phe Asn Gly Phe Thr Pro Glu Leu He Ala Gin Ser Phe 
225 230 235 240 

aac gtc gac caa gag acc gec cag aag eta caa gga caa aac gac cag 768 
Asn Val Asp Gin Glu - Thr Ala Gin Lys Leu Gin Gly Gin Asn Asp Gin 
245 250 255 

aga ggc cac att gtt aat gtc gga caa gac ctt caa ata gtc cgc cca 816 
Arg Gly His He Val Asn Val Gly Gin Asp Leu Gin He Val Arg Pro 
260 265 270 

cca caa gac aga cgc tct cct cgc caa caa caa gag caa gcg acg tct 864 
Pro Gin Asp Arg Arg Ser Pro Arg Gin Gin Gin Glu Gin Ala Thr Ser 
275 280 285 

cct cgc caa caa caa gag cag cag caa ggc aga cgt ggc gga tgg age 912 
Pro Arg Gin Gin Gin Glu Gin Gin Gin Gly Arg Arg Gly Gly Trp Ser 
290 295 300 
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aac ggt gtg gaa gaa acc ate tgc age atg aag ttc aaa gtg aac att 960- 
Asn Gly Val Glu Glu Thr lie Cys Ser Met Lys Phe Lys Val Asn lie ■ 
305 310 315 320 

gac aac cct tec cag get gac ttt gta aac ccg caa gec ggc age att 1008 
Asp Asn Pro Ser Gin Ala Asp Phe Val Asn Pro Gin Ala Gly Ser lie 
325 330 335 

gca aac etc aac age ttc aaa ttc ccc att etc gag cac etc egg etc 1056 
Ala Asn Leu Asn Ser Phe Lys Phe Pro lie Leu Glu His Leu Arg Leu 
340 345 350 

age gtg gaa aga ggc gaa etc cgt ccg aat gee ate caa tec cca cac 1104 
Ser Val Glu Arg Gly Glu Leu Arg Pro Asn Ala lie Gin Ser Pro His 
355 360 365 

tgg aca ate aac gee cac aat ctt etc tac gta acc gag gga gee ttg 1152 
Trp Thr lie Asn Ala His Asn Leu Leu Tyr Val Thr Glu Gly Ala Leu 
370 375 380 

agg gta caa ate gtc gac aac caa gga aac tea gtt ttc gac aac gag 1200 
Arg Val Gin lie Val Asp Asn Gin Gly Asn Ser Val Phe Asp Asn Glu 
385 390 395 400 

etc cgt gag gga- cag gtg gtg gtg ate ccg cag aac ttt gcg gtg. ate 1248 
Leu Arg Glu Gly Gin Val Val Val lie Pro Gin Asn Phe Ala Val lie 
405 410 415 

aag aga gee aat gaa caa gga age agg tgg gtg tct ttc aag act aat 1296 
Lys Arg Ala Asn Glu Gin Gly Ser Arg Trp Val Ser Phe Lys Thr Asn 
420 425 430 

gat aat gee atg ata gca aac ctt gca ggg cgt gtg tec gca tea gca 1344 
Asp Asn Ala Met He Ala Asn Leu Ala Gly Arg Val Ser Ala Ser Ala 
435 440 445 

gca teg ccg ttg acg ttg tgg gcg aat egg tat cag eta tct cga gag 1392 
Ala Ser Pro Leu Thr Leu Trp Ala Asn Arg Tyr Gin Leu Ser Arg Glu 
450 455 460 

gaa get cag cag etc aag ttt age cag agg gag acg gtt ttg ttt gca 1440 
Glu Ala Gin Gin Leu Lys Phe Ser Gin Arg Glu Thr Val Leu Phe Ala 
465 470 475 480 

cca agt ttt tec agg ggc caa ggg ate agg get tea cgt taa 1482 
Pro Ser Phe Ser Arg Gly Gin Gly He Arg Ala Ser Arg 
485 490 

<210> 30 
<211> 493 
<212> PRT 

<213> Helianthus annuus 
<400> 30 

Met Ala Ser Lys Ala Thr Leu Leu Leu Ala Phe Thr Leu Leu Phe Ala 
15 10 15 

Thr Cys He Ala Arg His Gin Gin Arg Gin Gin Gin Gin Asn Gin Cys 
20 25 30 

Gin Leu Gin Asn He Glu Ala Leu Glu Pro He Glu Val He Gin Ala 
35 40 45 

Glu Ala Gly Val Thr Glu He Trp Asp Ala Tyr Asp Gin Gin Phe Gin 
50 55 60 



Cys Ala Trp Ser He Leu Phe Asp Thr Gly Phe Asn Leu Val Ala Phe 
65 70 75 80 
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Ser Cys Leu Pro Thr Ser Thr Pro Leu Phe Trp Pro Ser Ser Arg Glu 
85 90 95 

Gly Val He Leu Pro Gly Cys Arg Arg Thr. Tyr Glu Tyr Ser Gin Glu 
100 " 105 110 

Gin Gin Phe Ser Gly Glu Gly Gly Arg Arg Gly Gly Gly Glu Gly Thr 
115 120 125 

Phe Arg Thr Val He Arg Lys Leu Glu Asn Leu Lys Glu Gly Asp Val 
130 135 140 

Val Ala He Pro Thr Gly Thr Ala His Trp Leu. His Asn Asp Gly Asn 
145 150 155 160 

Thr Glu Leu Val Val Val Phe Leu Asp Thr Gin Asn His Glu Asn Gin 
165 170 175 

Leu Asp Glu Asn Gin Arg Arg Phe Phe Leu Ala Gly Asn Pro Gin Ala 
180 185. 190 

Gin Ala Gin Ser Gin Gin Gin Gin Gin Arg Gin Pro Arg Gin Gin Ser 
195 200 205 

Pro Gin Arg Gin Arg Gin Arg Gin Arg Gin Gly Gin Gly Gin Asn Ala 
210 • 215 220 

Gly Asn He Phe Asn Gly Phe Thr Pro Glu Leu He Ala Gin Ser Phe 
225 230 235 240 

Asn Val Asp Gin Glu Thr Ala Gin Lys Leu Glri Gly Gin Asn Asp Gin 
245 250 255 

Arg Gly His He Val Asn Val Gly Gin Asp Leu Gin He Val Arg Pro 
260 265 270 

Pro Gin Asp Arg Arg Ser Pro Arg Gin Gin Gin Glu Gin Ala Thr Ser 
275 280 285 

Pro Arg Gin Gin Gin Glu Gin Gin Gin Gly Arg Arg Gly Gly Trp Ser 
290 295 300 

Asn Gly Val Glu Glu Thr He Cys Ser Met Lys Phe Lys Val Asn He 
305 310 315 320 

Asp Asn Pro Ser Gin Ala Asp Phe Val Asn Pro Gin Ala Gly Ser He 
325 330 335 

Ala Asn Leu Asn Ser Phe Lys Phe Pro He Leu Glu His Leu Arg Leu 
340 345 350 

Ser Val Glu Arg Gly Glu Leu Arg Pro Asn Ala He Gin Ser Pro His 
355 360 365 

Trp Thr He Asn Ala His Asn Leu Leu Tyr Val Thr Glu Gly Ala Leu 
370 375 380 

Arg Val Gin He Val Asp Asn Gin Gly Asn Ser Val Phe Asp Asn Glu 
385 390 395 400 

Leu Arg Glu Gly Gin Val Val Val He Pro Gin Asn Phe Ala Val He 
405 410 415 

Lys Arg Ala Asn Glu Gin Gly Ser Arg Trp Val Ser Phe Lys Thr Asn 
420 425 430 

Asp Asn Ala Met He Ala Asn Leu Ala Gly Arg Val Ser Ala Ser Ala 
435 440 445 

Ala Ser Pro Leu Thr Leu Trp Ala Asn Arg Tyr Gin Leu Ser Arg Glu 
450 455 460 
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Glu Ala Gin Gin Leu Lys Phe Ser Gin Arg Glu Thr Val Leu Phe Ala 
465 470 475 480 

Pro Ser Phe Ser Arg Gly Gin Gly He Arg Ala Ser Arg 
485 490 



<210> 31 
<211> 537 
<212> DNA 

<213> Brassica napus 

<220> 
<221> CDS 
<222> (1) . . (534) 
<223> NAPIN 

<400> 31 

atg gcg aac aag etc ttc etc gtc teg gca act etc gee ttc ttc ttc 48 
Met Ala Asn Lys Leu Phe Leu Val Ser Ala Thr Leu Ala Phe Phe Phe 
1 5-10 15 

ctt etc acc aat gec tec ate tac egg acg gtc gtc gag ttc gac gaa 96 
Leu Leu Thr Asn Ala Ser He Tyr Arg Thr Val Val Glu Phe Asp Glu 
20 25 30 

gat gat gee aca gac tea gee ggc cca ttt agg att cca aaa tgt agg * 144 
Asp Asp Ala Thr Asp Ser Ala Gly Pro Phe Arg He Pro Lys Cys Arg 
35 40 45 

aag gag ttt cag caa gca caa cac eta aga get tgc cag cag tgg etc • 192 
Lys Glu Phe Gin Gin Ala Gin His Leu Arg Ala Cys Gin Gin Trp Leu 
50 55 60 

cac aag caa gca atg cag tct ggc ggt ggt cct age tgg acc etc gac 240 
His Lys Gin Ala Met Gin Ser Gly Gly Gly Pro Ser Trp Thr Leu Asp 
65 70 75 80 

ggt gag ttt gac ttt gaa gac gac atg gag aac ccg cag ggt cca cag 288 
Gly Glu Phe Asp Phe Glu Asp Asp Met Glu Asn Pro Gin Gly Pro Gin 
85 90 95 

cag aga ccg cct eta etc cag cag tgc tgt aac gag etc cac cag gaa 336 
Gin Arg Pro Pro Leu Leu Gin Gin Cys Cys Asn Glu Leu His Gin Glu 
100 105 110 

gag ccc ctt tgc gtt tgc cca acc ttg aaa gga gca tec aaa gcg gtt 384 
Glu Pro Leu Cys Val Cys Pro Thr Leu Lys Gly Ala Ser Lys Ala Val 
115 120 125 

aaa caa caa att caa caa cag gga caa cag caa gga aag cag caa atg 432 
Lys Gin Gin He Gin Gin Gin Gly Gin Gin Gin Gly Lys Gin Gin Met 
130 135 140 

gtg age cgt ate tac cag acc get acg cac tta cct aaa gtt tgc aac 480 
Val Ser Arg He Tyr Gin Thr Ala Thr His Leu Pro Lys Val Cys Asn 
145 150 155 160 

ate ccg caa gtt age gtt tgt ccc ttc cag aag acc atg cct ggg ccc 528 
He Pro Gin Val Ser Val Cys Pro Phe Gin Lys Thr Met Pro Gly Pro 
165 170 175 

tec tac tag 537 
Ser Tyr 



<210> 32 
<211> 178 
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<212> PRT 

<213> Brassica napus 
<400> 32 

Met Ala Asn Lys Leu Phe Leu Val Ser Ala Thr Leu Ala Phe Phe Phe 
1 5 10-15 

Leu Leu Thx Asn Ala Ser lie Tyr Arg Thr Val Val Glu Phe Asp Glu 
20 25 30 

Asp Asp Ala Thr Asp Ser Ala Gly Pro Phe Arg lie Pro Lys Cys Arg 
35 40 45 

Lys Glu Phe Gin Gin Ala Gin His Leu Arg Ala Cys Gin Gin Trp Leu 
50 55 60 

His Lys Gin Ala Met Gin Ser Gly Gly Gly Pro Ser Trp Thr Leu Asp 
65 70 75 80 

Gly Glu Phe Asp Phe Glu Asp Asp Met Glu Asn Pro Gin Gly Pro Gin 
85 90 95 

Gin Arg Pro Pro Leu Leu Gin Gin Cys Cys Asn Glu Leu His Gin Glu 
100 105 110 

Glu Pro Leu Cys Val Cys Pro Thr Leu Lys Gly Ala Ser Lys Ala Val 
115 120 125 

Lys Gin Gin lie Gin Gin Gin Gly Gin Gin Gin Gly Lys Gin Gin Met 
130 135 140 

Val Ser Arg lie Tyr Gin Thr Ala Thr His Leu Pro Lys Val Cys Asn 
145 150 155 160 

lie Pro Gin Val Ser Val Cys Pro Phe Gin Lys Thr Met Pro Gly Pro 
165 170 175 

Ser Tyr 



<210> 33 
<211> 537 
<212> DNA 

<213> Brassica juncea 

<220> 

<221> CDS 

<222> (1) . . (534) 

<223> 2S storage protein 

<400> 33 

atg gcg aac aag etc ttc etc gtc teg gca act etc gee ttc ttc ttc 48 

Met Ala Asn Lys Leu Phe Leu Val Ser Ala Thr Leu Ala Phe Phe Phe 
1 5 10 • 15 

ctt etc acc aat gee tec ate tac egg acg gtc gtc gag ttc gac gaa 96 
Leu Leu Thr Asn Ala Ser lie Tyr Arg Thr Val Val Glu Phe Asp Glu 
20 25 30 

gat gat gee aca gac tea gee ggc cca ttt agg att cca aaa tgt agg 144 
Asp Asp Ala Thr Asp Ser Ala Gly Pro Phe Arg lie Pro Lys Cys Arg 
35 40 45 

aag gag ttt cag caa gca caa cac eta aga gtc tgc cag cag tgg etc 192 
Lys Glu Phe Gin Gin Ala Gin His Leu Arg Val Cys Gin Gin Trp Leu 
50 55 60 
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cac aag caa gca atg cag tct ggc ggt ggt etc age tgg ace etc gac 240 

His Lys Gin Ala Met Gin Ser Gly Gly Gly Leu Ser Trp Thr Leu Asp 
65 70 75 .80 

ggt gag ttt gac ttt gaa gac gac atg gag aac teg cag ggt cca cag 288 
Gly Glu Phe Asp Phe Glu Asp Asp Met Glu Asn Ser Gin Gly Pro Gin 
85 90 95 

cag aga ccg cct eta etc cag cag tgc tgt aac gag etc cac cag gaa 336 
Gin Arg Pro Pro Leu Leu Gin Gin Cys Cys Asn Glu Leu His Gin Glu 
100 105 110 

gag ccc ctt tgc gtt tgc cca ace ttg aaa gga gca tec aaa gcg gtt 384 
Glu Pro Leu Cys Val Cys Pro Thr Leu Lys Gly Ala Ser Lys Ala Val 
115 120 125 

aaa caa caa att caa caa cag gga caa cag caa gga aag cag caa atg 432 
Lys Gin Gin He Gin Gin Gin Gly Gin Gin Gin Gly Lys . Gin Gin Met 
130 135 140 

gtg age cgt ate tac cag ace get acg cac tta cct aaa gtt tgc aac 480 
Val Ser Arg He Tyr Gin Thr Ala Thr His Leu Pro Lys Val Cys Asn 
145 150 155 160 

ate ccg caa gtt age gtt tgt ccc ttc cag aag ace atg cct ggg ccc 528 
He Pro Gin Val Ser Val Cys Pro Phe Gin Lys Thr Met Pro Gly Pro 
165 170 175 

tec tac tag 537 
Ser Tyr 

<210> 34 
<211> 178 
<212> PRT 

<213> Brassica juncea 
<400> 34 

Met Ala Asn Lys Leu Phe Leu Val Ser Ala Thr Leu Ala Phe Phe Phe 
1 "5 10 15 

Leu Leu Thr Asn Ala Ser He Tyr Arg Thr Val Val Glu Phe Asp Glu 
20 25 30 

Asp Asp Ala Thr Asp Ser Ala Gly Pro Phe Arg He Pro Lys Cys Arg 
35 40 45 

Lys Glu Phe Gin Gin Ala Gin His Leu Arg Val Cys Gin Gin Trp Leu 
50 55 60 

His Lys Gin Ala Met Gin Ser Gly Gly Gly Leu Ser Trp Thr Leu Asp 
65 70 75 80 

Gly Glu Phe Asp Phe Glu Asp Asp Met Glu Asn Ser Gin Gly Pro Gin 
85 90 95 

Gin Arg Pro Pro Leu Leu Gin Gin Cys Cys Asn Glu Leu His Gin Glu 
100 105 110 

Glu Pro Leu Cys Val Cys Pro Thr Leu Lys Gly Ala Ser Lys Ala Val 
115 120 125 

Lys Gin Gin He Gin Gin Gin Gly Gin Gin Gin Gly Lys Gin Gin Met 
130 135 140 

Val Ser Arg He Tyr Gin Thr Ala Thr His Leu Pro Lys Val Cys Asn 
145 150 155 160 



He Pro Gin Val Ser Val Cys Pro Phe Gin Lys Thr Met Pro Gly Pro 
165 170 175 
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Ser Tyr 



<210> 35 
<211> 537 
<212> DNA 

<213> Brassica oleracea 

<220> 

<221> CDS 

<222> (1) . . (534) 

<223> 2S storage protein 

<400> 35 

atg gcg aac aag etc ttc etc gtc teg gca act etc gec ttc ttc ttc 48 

Met Ala Asn Lys Leu Phe Leu Val Ser Ala Thr Leu Ala Phe Phe Phe 
1 5 10 15 

ctt etc ace aat gee tec ate tac egg acg gtg gtc gag ttc gac gaa- 96 
Leu Leu Thr Asn Ala Ser lie Tyr Arg Thr Val Val Glu Phe Asp Glu 
20 -25 30 

gat gat gee aca aac cca gee ggc cca ttt agg ate cca aaa tgt agg 144 
Asp Asp Ala Thr Asn Pro Ala Gly Pro Phe Arg . lie Pro Lys Cys Arg 
35 40 45 

aag gag ttt cag caa gca caa cac eta aga get tgc cag cag tgg etc 192 
Lys Glu Phe Gin Gin Ala Gin His Leu Arg Ala Cys Gin Gin Trp Leu 
50 -55 60 

cac aag caa gca atg cag tct ggc ggt ggt cct age tgg acc etc gac 240 
His Lys Gin Ala Met Gin Ser Gly Gly Gly Pro Ser Trp Thr Leu Asp 
65 70 75 80 

agt gag ttt gac ttt gaa gac gac atg gag aac ccg cag ggt cca cag 288 
Ser Glu Phe Asp Phe Glu Asp Asp Met Glu Asn Pro Gin Gly Pro Gin 
85 90 95 

cag aga ccg cct eta etc ctg caa tgc tgt aac gag ctg gac cag gaa 336 
Gin Arg Pro Pro Leu Leu Leu Gin Cys Cys Asn Glu Leu Asp Gin Glu 
100 105 110 

gag ccc ctt tgc gtt tgc cca acc ttg aaa gga gca tec aaa gcg gtt 384 
Glu Pro Leu Cys Val Cys Pro Thr Leu Lys Gly Ala Ser Lys Ala Val 
115 120 125 

aaa caa caa att caa caa cag gga caa cag caa gga aag cag caa atg 432 
Lys Gin Gin He Gin Gin Gin Gly Gin Gin Gin Gly Lys Gin Gin Met 
130 135 140 

gtg age cgt ate tac cag acc get acg cac tta cct aaa gtt tgc aac 480 
Val Ser Arg He Tyr Gin Thr Ala Thr His Leu Pro Lys Val Cys Asn 
145 150 155 160 

ate ccg caa gtt age gtt tgt ccc ttc cag aag acc atg cct ggg ccc 528 
He Pro Gin Val Ser Val Cys Pro Phe Gin Lys Thr Met Pro Gly Pro 
165 170 175 

tec tac tag 537 
Ser Tyr 

<210> 36 
<211> 178 
<212> PRT 

<213> Brassica oleracea 
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<400> 36 

Met Ala Asn Lys Leu Phe Leu Val Ser Ala Thr Leu Ala Phe Phe Phe 
1 5 10 15 

Leu Leu Thr Asn Ala Ser lie Tyr Arg Thr Val Val Glu Phe Asp Glu 
20 25 30 

Asp Asp Ala Thr Asn Pro Ala Gly Pro Phe Arg lie Pro Lys Cys Arg 
' 35 40 45 

Lys Glu Phe Gin Gin Ala Gin His Leu Arg Ala Cys Gin Gin Trp Leu 
50 55 60 

His Lys Gin Ala Met Gin Ser Gly Gly Gly Pro Ser Trp Thr Leu Asp 
65 70 75 80 

Ser Glu Phe Asp Phe Glu Asp Asp Met Glu Asn Pro Gin Gly Pro Gin 
85 90 95 

Gin Arg Pro Pro Leu Leu Leu Gin Cys Cys Asn Glu Leu Asp Gin Glu 
100 105 110 - 

Glu Pro Leu Cys Val Cys Pro Thr Leu Lys Gly Ala Ser Lys Ala Val 
115 120 125 

Lys Gin Gin lie Gin Gin Gin Gly Gin Gin Gin Gly Lys Gin Gin Met 
130 135 140 

Val Ser Arg lie Tyr Gin Thr Ala Thr His Leu Pro Lys Val Cys Asn 
145 150 155 160 

He Pro Gin Val Ser Val Cys Pro Phe Gin Lys Thr Met Pro Gly Pro 
165 170 .175 

Ser Tyr 



<210> 37 
<211> 543 
<212> DNA 

<213> Brass ica napus cv. Topas 

<220> 
<221> CDS 
<222> (1)..(540) 
<223> Napin 

<400> 37 

atg gcg aac aag etc ttc etc gtc teg gca act ctt gec ttc ttc ttc 48 
Met Ala Asn Lys Leu Phe Leu Val Ser Ala Thr Leu Ala Phe Phe Phe 
1 5 10 15 

ctt etc acc aac gee tec ate tac cgc acc ate gtg gaa gtc gac gaa 9 6 
Leu Leu Thr Asn Ala Ser He Tyr Arg Thr He Val Glu Val Asp Glu 
20 25 30 

gat gat gee aca aac cca gec ggc cca ttt agg att cca aaa tgt agg 144 
Asp Asp Ala Thr Asn Pro Ala Gly Pro Phe Arg He Pro Lys Cys Arg 
35 40 45 

aag gag ttt cag caa gca caa cac ctg aaa get tgc caa caa tgg etc 192 
Lys Glu Phe Gin Gin Ala Gin His Leu Lys Ala Cys Gin Gin Trp Leu 
50 55 60 

cac aag cag gca atg cag tec ggt agt ggc cca age tgg acc etc gac 240 
His Lys Gin Ala Met Gin Ser Gly Ser Gly Pro Ser Trp Thr Leu Asp 
65 70 75 80 
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ggt gag ttt gat ttt gaa gat gac atg gag aac ccc cag ggc cca caa 288 
Gly Glu Phe Asp Phe Glu Asp Asp Met Glu Asn Pro Gin Gly Pro Gin 
85 90 95 . 

cag agg ccg cca eta etc cag cag tgc tgc aac gag etc cac cag gaa 336 
Gin Arg Pro Pro Leu Leu Gin Gin Cys Cys Asn Glu Leu His Gin Glu 
100 105 -110 

gag cca ctt tgc gtt tgc cca ace ttg aaa gga gca tec aaa gec gtt 384 
Glu Pro Leu Cys Val Cys Pro Thr Leu Lys Gly Ala Ser Lys Ala Val 
115 120 125 

aaa caa cag gtt cga caa cag caa gga cag cag gga cag cag ctg cag 432 
Lys Gin Gin Val Arg Gin Gin Gin Gly Gin Gin Gly Gin Gin Leu Gin 
130 135 140 

caa gta att age cgt ate tac cag act get acg cac tta cct aaa gtt 480 
Gin Val lie Ser Arg lie Tyr Gin Thr Ala Thr His Leu Pro Lys Val 
145 150 155 160 

tgc aac ate ccg caa gtt age gtt tgt ccc ttc cag aag acc atg cct 528 
Cys Asn lie Pro Gin Val Ser Val Cys Pro Phe Gin Lys Thr Met Pro 
165 170 175 

gga ccc tec tac tag 543 
Gly Pro Ser Tyr 
180 

<210> 38 
<211>" 180 
<212> PRT 

<213> Brass ica napus cv. Topas 
<400> 38 

Met Ala Asn Lys Leu Phe Leu Val Ser Ala Thr Leu Ala Phe Phe Phe 
1 5 10 15 

Leu Leu Thr Asn Ala Ser lie Tyr Arg Thr lie Val Glu Val Asp Glu 
20 25 30 

Asp Asp'* Ala Thr Asn Pro Ala Gly Pro Phe Arg lie Pro Lys Cys Arg 
35 40 45 

Lys Glu Phe Gin Gin Ala Gin His Leu Lys Ala Cys Gin Gin Trp Leu 
50 55 60 

His Lys Gin Ala Met Gin Ser Gly Ser Gly Pro Ser Trp Thr Leu Asp 
65 70 75 80 

Gly Glu Phe Asp Phe Glu Asp Asp Met Glu Asn Pro Gin Gly Pro Gin 
85 90 95 

Gin Arg Pro Pro Leu Leu Gin Gin Cys Cys Asn Glu Leu His Gin Glu 
100 105 110 

Glu Pro Leu Cys Val Cys Pro Thr Leu Lys Gly Ala Ser Lys Ala Val 
115 120 125 

Lys Gin Gin Val Arg Gin Gin Gin Gly Gin Gin Gly Gin Gin Leu Gin 
130 135 140 

Gin Val lie Ser Arg lie Tyr Gin Thr Ala Thr His Leu Pro Lys Val 
145 150 155 160 

Cys Asn lie Pro Gin Val Ser Val Cys Pro Phe Gin Lys Thr Met Pro 
165 170 175 



Gly Pro Ser Tyr 
180 
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<210> 39 
<211> 435 
<212> DNA 

<213> Sinapis alba 

<220> 

<221> CDS 

<222> (1) . . (432) 

<223> coding for partial sinl storage protein 
<400> 39 

cca gcc ggc cca ttt ggg att cca aaa tgt agg aag gag ttt caa caa 48 
Pro Ala Gly Pro Phe Gly lie Pro Lys Cys Arg Lys Glu Phe Gin Gin 
15 10 15 

gca caa cac eta aga get tgc cag caa tgg etc cac aag cag gca atg 96 
Ala Gin His Leu Arg Ala Cys Gin Gin Trp Leu His Lys Gin Ala Met 
20 25 30 

cag tct ggt agt ggt cca age tgg ace etc gac gat gag ttt gat ttt 144 
Gin Ser Gly Ser Gly Pro Ser Trp Thr Leu Asp Asp Glu Phe Asp Phe 
35 40 45 

gaa gat gac atg gag aac cca cag gga cca cag cag agg cca cca eta 192 
Glu Asp Asp Met Glu Asn Pro Gin Gly Pro Gin Gin Arg Pro Pro Leu 
50 55 60 

etc cag cag tgc tgc aac gag etc cac cag gaa gag cca ctt tgc gtt 240 
Leu Gin Gin Cys Cys Asn Glu Leu His Gin Glu Glu Pro Leu Cys Val 
65 70 75 80 

tgc cca ace ttg aaa gga gca tec aaa gcc gtt aaa cag cag gtt aga 288 
Cys Pro Thr Leu Lys Gly Ala Ser Lys Ala Val Lys Gin Gin Val Arg 
85 90 95 

caa cag ctg gag cag cag gga cag cag gga ccg cac ctg cag cat gta 33 6 
Gin Gin Leu Glu Gin Gin Gly Gin Gin Gly Pro His Leu Gin His Val 
100 105 110 

att age cgt ate tac cag acc get acg cac tta cct aga gtt tgc aac 384 
lie Ser Arg lie Tyr Gin Thr Ala Thr His Leu Pro Arg Val Cys Asn 
115 120 125 

att agg caa gtt .age gtt tgt ccc ttc cag aag acc atg cct gga ccc 432 
lie Arg Gin Val Ser Val Cys Pro Phe Gin Lys Thr Met Pro Gly Pro 
130 135 140 

tec 435 

<210> 40 
<211> 144 
<212> PRT 

<213> Sinapis alba 
<400> 40 

Pro Ala Gly Pro Phe Gly lie Pro Lys Cys Arg Lys Glu Phe Gin Gin 
15 10 15 

Ala Gin His Leu Arg Ala Cys Gin Gin Trp Leu His Lys Gin Ala Met 
20 25 30 

Gin Ser Gly Ser Gly Pro Ser Trp Thr Leu Asp Asp Glu Phe Asp Phe 
35 40 45 



Glu Asp Asp Met Glu Asn Pro Gin Gly Pro Gin Gin Arg Pro Pro Leu 
50 55 60 
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Leu Gin Gin Cys Cys Asn Glu Leu His Gin Glu Glu Pro Leu Cys Val 
65 70 75 80 

Cys Pro Thr Leu Lys Gly Ala Ser Lys Ala Val Lys Gin Gin Val Arg 
85 90 95 

Gin Gin Leu Glu Gin Gin Gly Gin Gin Gly Pro His Leu Gin His Val 
100 105 110 

lie Ser Arg lie Tyr Gin Thr Ala Thr His Leu Pro Arg Val Cys Asn 
115 120 125 

lie Arg Gin Val Ser Val Cys Pro Phe Gin Lys Thr Met Pro Gly Pro 
130 135 140 



<210> 41 

<211> 468 

<212> DNA 

<213> Glycine max 

<220> 

<221> CDS 

<222> (1) . . (465) 

<223> 2S albumine 1 

<400> 41 

atg acc aag ctt aca att etc etc ate get ctt etc ttc ate gee cac 48 

Met Thr Lys Leu Thr lie Leu Leu lie Ala Leu Leu Phe lie Ala His 
15 10 15 

acc tgc tgc gec tec aaa tgg caa cag cac cag caa gag age tgc cgc 96 
Thr Cys Cys Ala Ser Lys Trp Gin Gin His Gin Gin Glu Ser Cys Arg 
20 25 30 

gag cag etc aag ggg .ate aac etc aac ccc tgt gag cac ate atg gag 144 
Glu Gin Leu Lys Gly lie Asn Leu Asn Pro Cys Glu His lie Met Glu 
35 40 ' 45 

aag ate caa get ggc cgc cgc ggc gag gac ggc age gac gaa gat cac 192 
Lys lie Gin Ala Gly Arg Arg Gly Glu Asp Gly Ser Asp Glu Asp His 
50 55 60 

att etc ate agg acc atg ccg gga aga ate aac tac ate agg aag aag 240 
lie Leu lie Arg Thr Met Pro Gly Arg lie Asn Tyr lie Arg Lys Lys 
65 70 75 80 

gaa gga aaa gaa gaa gaa gaa gaa gga cac atg cag aag tgc tgc age 288 
Glu Gly Lys Glu Glu Glu Glu Glu Gly His Met Gin Lys Cys Cys Ser 
85 90 95 

gaa atg age gag ctg aaa age ccc ata tgc cag tgc aaa gcg eta cag 336 
Glu Met Ser Glu Leu Lys Ser Pro lie Cys Gin Cys Lys Ala Leu Gin 
100 105 110 

aag ata atg gat aac cag age gag caa ctg gag ggg aag gag aag aag 384 
Lys lie Met Asp Asn Gin Ser Glu Gin Leu Glu Gly Lys Glu Lys Lys 
115 120 125 

cag atg gag aga gag etc atg aac ttg get att agg tgc agg ttg gga 432 
Gin Met Glu Arg Glu Leu Met Asn Leu Ala lie Arg Cys Arg Leu Gly 
130 135 140 

ccc atg ata ggg tgc gac ttg tec tec gat gac tga 468 
Pro Met lie Gly Cys Asp Leu Ser Ser Asp Asp 
145 150 155 
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<210> 42 

<211> 155 

<212> PRT 

<213> Glycine max 

<400> 42 

Met Thr Lys Leu Thr lie Leu Leu He Ala Leu Leu Phe He Ala His 
15 10 15 

Thr Cys Cys Ala Ser Lys Trp Gin Gin His Gin Gin Glu Ser Cys Arg 
20 25 30 

Glu Gin Leu Lys Gly He Asn Leu Asn Pro Cys Glu His He Met Glu 
35 40 45 

Lys He Gin Ala Gly Arg Arg Gly Glu Asp Gly Ser Asp Glu Asp His 
50 55 60 

He Leu He Arg Thr Met Pro Gly Arg He Asn Tyr He Arg Lys Lys 
65 70 75 80 

Glu Gly Lys Glu Glu Glu Glu Glu Gly His Met Gin Lys Cys Cys Ser 
85 90 95 

Glu Met Ser Glu Leu Lys Ser Pro He Cys Gin Cys Lys Ala Leu Gin 
100 105 110 

Lys He Met Asp Asn Gin Ser Glu Gin Leu Glu Gly Lys Glu Lys Lys 
115 120 " 125 

Gin Met Glu Arg Glu Leu Met Asn Leu Ala He Arg Cys Arg Leu Gly 
130 135 140 

Pro Met He Gly Cys Asp Leu Ser Ser Asp Asp 
145 150 155 



<210> 43 

<211> 477 

<212> DNA 

<213> Glycine max 

<220> 

<221> CDS 

<222> (1)..(474) 

<223> 2S albumine 

<400> 43 

atg acc aag ttc aca ate etc etc ate tct ctt etc ttc tgc ate gee 48 

Met Thr Lys Phe Thr He Leu Leu He Ser Leu Leu Phe Cys He Ala 

1 5 10 15 

cac act tgc age gee tec aaa tgg cag cac cag caa gat age tgc cgc 96 
His Thr Cys Ser Ala Ser Lys Trp Gin His Gin Gin Asp Ser Cys Arg 
20 25 30 

aag cag etc cag ggg gtg aac etc acg ccc tgc gag aag cac ate atg 144 
Lys Gin Leu Gin Gly Val Asn Leu Thr Pro Cys Glu Lys His He Met 
35 40 45 

gag aag ate caa ggc cgc ggc gat gac gat gat gat gat gac gac gac 192 
Glu Lys He Gin Gly Arg Gly Asp Asp Asp Asp Asp Asp Asp Asp Asp 
50 55 60 

aat cac att etc agg acc atg egg gga aga ate aac tac ata agg agg 240 
Asn His He Leu Arg Thr Met Arg Gly Arg He Asn Tyr He Arg Arg 
65 70 75 80 
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aac gaa gga aaa gac gaa gac gaa gaa gaa gaa gga cac atg cag aag 288 
Asn Glu Gly Lys Asp Glu Asp Glu Glu Glu Glu Gly His Met Gin Lys 
85 90 95 

tgc tgc aca gaa atg age gag ctg aga age ccc aaa tgc cag tgc aaa 336 
Cys Cys Thr Glu Met Ser Glu Leu Arg Ser Pro Lys Cys Gin Cys Lys 
100 105 no 

gcg ctg cag aag ata atg gag aac cag age gag gaa ctg gag gag aag 384 
Ala Leu Gin Lys lie Met Glu Asn Gin Ser Glu Glu Leu Glu Glu Lys 
115 120 125 • 

cag aag aag aaa atg gag aag gag etc att aac ttg get act atg tgc 432 
Gin Lys Lys Lys Met Glu Lys Glu Leu lie Asn Leu Ala Thr Met Cys 
130 135 140 

agg ttt gga ccc atg ate cag tgc gac ttg tec tec gat gac taa 477 
Arg Phe Gly Pro Met He Gin Cys Asp Leu Ser Ser Asp Asp 
145 150 155 

<210> 44 

<211> 158 

<212> PRT 

<213> Glycine max 

<400> 44 

Met Thr Lys Phe Thr He Leu Leu He Ser Leu Leu Phe Cys He Ala 
1 5 10 15 

His Thr Cys Ser Ala Ser Lys Trp Gin His Gin Gin Asp Ser Cys Arg 
20 25 30 

Lys Gin Leu Gin Gly Val Asn Leu Thr Pro Cys Glu Lys His He Met 
35 40 45 

Glu Lys He Gin Gly Arg Gly Asp Asp Asp Asp Asp Asp Asp Asp Asp 
50 55 60 

Asn His He Leu Arg Thr Met Arg Gly Arg He Asn Tyr He Arg Arg 
65 70 75 " 80 

Asn Glu Gly Lys Asp Glu Asp Glu Glu Glu Glu Gly His Met Gin Lys 
85 90 95 

Cys Cys Thr Glu Met Ser Glu Leu Arg Ser Pro Lys Cys Gin Cys Lys 
100 105 no 

Ala Leu Gin Lys He Met Glu Asn Gin Ser Glu Glu Leu Glu Glu Lys 
115 120 125 

Gin Lys Lys Lys Met Glu Lys Glu Leu He Asn Leu Ala Thr Met Cys 
130 135 140 

Arg Phe Gly Pro Met He Gin Cys Asp Leu Ser Ser Asp Asp 
145 150 155 



<210> 45 
<211> 537 
<212> DNA 

<213> Brassica nigra 

<220> 

<221> CDS 

<222> (1) . . (534) 

<223> 2S storage protein 
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<400> 45 

atg gcg aac aag etc ttc etc gtc teg gca act etc gec ttc ttc ttc 48 

Met Ala Asn Lys Leu Phe Leu Val Ser Ala Thr Leu Ala Phe Phe Phe 

1 5 10 15 

ctg etc ace aat gee tec ate tac egg acg gtc gtc gag ttc gac gaa 96 

Leu Leu Thr Asn Ala Ser lie Tyr Arg Thr Val Val Glu Phe Asp Glu 

20 25 30 

gat gat gac aca aac caa gec gga cca ttt agg att cca aga tgt cga 144 
Asp Asp Asp Thr Asn Gin Ala Gly Pro Phe Arg lie Pro Arg Cys Arg 
35 40 45 

aag gag ttt egg caa gca caa cat eta aga get tgc cag caa tgg etc 192 
Lys Glu Phe Arg Gin Ala Gin His Leu Arg Ala Cys Gin Gin Tip Leu 
50 55 60 

cac agg cag gca atg cag tec ggt agt ggt cca age tgg acc ctg gac 240 
His Arg Gin Ala Met Gin Ser Gly Ser Gly Pro Ser Tzp Thr Leu Asp 
65 • 70 75 80 

ggt gag ttt gac ttt gaa gac gac atg gag aac caa cag ggc cca cag 288 
Gly Glu Phe Asp Phe Glu Asp Asp Met Glu Asn Gin Gin Gly Pro Gin 

85 90 95 • 

cag agg cca cct eta etc cag caa tgc tgc aac gag etc cac cag gaa 336 
Gin Arg Pro Pro Leu Leu Gin Gin Cys Cys Asn Glu Leu His Gin Glu 
100 105 no 

gag gca ctt tgt gtt tgc cca acc ttg aaa gga gca tec aaa gcg gtt 384 
Glu Ala Leu Cys Val Cys Pro Thr Leu Lys Gly Ala Ser Lys Ala Val 

115 120 125 ■ 

aga caa cag gtt cga caa cag gga cac cag cag cag atg cag cat gta 432 
Arg Gin Gin Val Arg Gin Gin Gly His Gin Gin Gin Met Gin His Val 
130 135 140 

att age cgt ate tac cag acc get acg cac tta cct aga gtt tgc aac • 480 

He Ser Arg He Tyr Gin Thr Ala Thr His Leu Pro Arg Val Cys Asn 

145 150 155 160 

ate ccg caa gtt age gtt tgt ccc ttc cag aag acc atg cct ggg ccc 528 

He Pro Gin Val Ser Val Cys Pro Phe Gin Lys Thr Met Pro' Gly Pro 

165 170 175 

tec tac tag 53 7 

Ser Tyr 

<210> 46 
<211> 178 
<212> PRT 

<213> Brass ica nigra 
<400> 46 

Met Ala Asn Lys Leu Phe Leu Val Ser Ala Thr Leu Ala Phe Phe Phe 
1 5 io 15 

Leu Leu Thr Asn Ala Ser He Tyr Arg Thr Val Val Glu Phe Asp Glu 

20 25 30 

Asp Asp Asp Thr Asn Gin Ala Gly Pro Phe Arg He Pro Arg Cys Arg 
35 40 45 

Lys Glu Phe Arg Gin Ala Gin His Leu Arg Ala Cys Gin Gin Trp Leu 
50 55 60 

His Arg Gin Ala Met Gin Ser Gly Ser Gly Pro Ser Trp -Thr Leu Asp 
65 70 75 ~ 80 
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Gly Glu Phe Asp Phe Glu Asp Asp Met Glu Asn Gin Gin Gly Pro Gin 

85 90 95 

Gin Arg Pro Pro Leu Leu Gin Gin Cys Cys Asn Glu Leu His Gin Glu 
100 105 110 

Glu Ala Leu Cys Val Cys Pro Thr Leu Lys Gly Ala Ser Lys Ala Val 
115 120 125 

Arg Gin Gin Val Arg Gin Gin Gly His Gin Gin Gin Met Gin His Val 
130 135 140 

lie Ser Arg lie Tyr Gin Thr Ala Thr His Leu Pro Arg Val Cys Asn 
145 150 .155 160 

lie Pro Gin Val Ser Val Cys Pro Phe Gin Lys Thr Met Pro Gly Pro 
165 170 175 

Ser Tyr 



<210> 47 
<211> 435 
<212> DNA 

<213> Sinapis alba 

<220> 

<221> CDS 

<222> (1) . . (432) 

<223> sin5 storage protein 

<400> 47 

cca gcc ggc cca ttt ggg att cca aaa tgt agg aag gag ttt caa caa 48 
Pro Ala Gly Pro Phe Gly lie Pro Lys Cys Arg Lys Glu Phe Gin Gin 
15 10 15 

gca caa cac eta aga get tgc cag caa tgg etc cac aag cag gca atg 96 
Ala Gin His Leu Arg Ala Cys Gin Gin Trp Leu His Lys Gin Ala Met 
20 25 30 

cag tct ggt agt ggt cca age tgg ace etc gac gat gag ttt gat ttt 144 
Gin Ser Gly Ser Gly Pro Ser Tzp Thr Leu Asp Asp Glu Phe Asp Phe 
35 40 45 

gaa- gac gac atg gag aac ccc cag gga cca cag cag aag ccg cca eta 192 
Glu Asp Asp Met Glu Asn Pro Gin Gly Pro Gin Gin Lys Pro Pro Leu 
50 '55 60 

etc cag caa tgc tgc aac gag ctt cac cag gag gag cca ctt tgc gtt 240 
Leu Gin Gin Cys Cys Asn Glu Leu His Gin Glu Glu Pro Leu Cys Val 
65 70 75 80 

tgc cca act ttg aaa gga get tec aaa gcc gtt aaa caa cag gtt cga 288 
Cys Pro Thr Leu Lys Gly Ala Ser Lys Ala Val Lys Gin Gin. Val Arg 
85 90 95 

caa cag ttg ggg cag cag gga cag cag gga ccg cag gtg cag cat gta 336 
Gin Gin Leu Gly Gin Gin Gly Gin Gin Gly Pro Gin Val Gin His Val 
100 105 110 

att age cgt ate tac bag acc get acg cac tta cct aaa gtt tgc aac 3 84 
lie Ser Arg lie Tyr Gin Thr Ala Thr His Leu Pro Lys Val Cys Asn 
115 120 125 

ate ccc caa gta age gtt tgt ccc ttc aag aag acc atg cct gga ccc 432 
lie Pro Gin Val Ser Val Cys Pro Phe Lys Lys Thr Met Pro Gly Pro 
130 " 135 140 
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tec 



<210> 48 
<211> 144 
<212> PRT 

<213> Sinapis alba 
<400> 48 

Pro Ala Gly Pro Phe Gly lie Pro Lys Cys Arg Lys Glu Phe Gin Gin 
1 5 10 15 

Ala Gin His Leu Arg Ala Cys Gin Gin Trp Leu His Lys Gin Ala Met 
20 25 ^ 30 

Gin Ser Gly Ser Gly Pro Ser Trp Thr Leu Asp Asp Glu Phe Asp Phe 
35 40 45 

Glu Asp Asp Met Glu Asn Pro Gin Gly Pro Gin Gin Lys Pro Pro Leu 
50 55 60 

Leu Gin Gin Cys Cys Asn Glu Leu His Gin Glu Glu Pro Leu Cys Val 
65 70 75 80 

Cys Pro Thr Leu Lys Gly Ala Ser Lys Ala Val Lys Gin Gin Val Arg 
85 90 95 

Gin Gin Leu Gly Gin Gin Gly Gin Gin Gly Pro Gin Val Gin His Val 
100 105 no 

lie Ser Arg lie Tyr Gin Thr Ala Thr His Leu Pro Lys Val Cys Asn 
115 120 125 

He Pro Gin Val Ser Val Cys Pro Phe Lys Lys Thr Met Pro Gly Pro 
130 135 140 



435 



<210> 49 
<211> 888 
<212> DNA 

<213> Helianthus annuus 

<220> 

<221> CDS 

<222> (1).J(885) 

<223> HaG5 2S albumine 

<400> 49 

atg gca aag caa ata gtt etc gca etc get ttc gee gee ctt gta gee 48 
Met Ala Lys Gin He Val Leu Ala Leu Ala Phe Ala Ala Leu Val Ala 
15 10 15 

ttt get ace gee cac aca acc ata ate ace ace ace ate gaa gac gag 96 
Phe Ala Thr Ala His Thr Thr He He Thr Thr Thr He Glu Asp Glu 
20 25 30 

aac ccg ate tec gga caa agg caa gtg age caa egg ata cag gga caa 144 
Asn Pro He Ser Gly Gin Arg Gin Val Ser Gin Arg He Gin Gly Gin 
35 40 45 

agg ctg aac cag tgt cgc atg ttc etc cag cag ggt cag aac att cct 192 
Arg Leu Asn Gin Cys Arg Met Phe Leu Gin Gin Gly Gin Asn He Pro 
50 55 60 

cgc gaa ttc gat aac cct cag atg ggg egg cag cag gag cag cag etc 240 
Arg Glu Phe Asp Asn Pro Gin Met Gly Arg Gin Gin Glu Gin Gin Leu 
65 70 75 80 
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cag cag tgt tgt caa gag etc caa aac ate gaa ggg cag tgc caa tgt 288 

Gin Gin Cys Cys Gin Glu Leu Gin Asn lie Glu Gly Gin Cys Gin Cys 
85 90 95 

gag gcg gtg aag cag gtg ttc cga gaa gee cag cag caa gta caa cag 336 
Glu Ala Val Lys Gin Val Phe Arg Glu Ala Gin Gin Gin Val Gin Gin 
100 105 110 

caa cag gga egg cag ctt gta ccc ttc cgc ggt teg cag cag ace caa 3 84 
Gin Gin Gly Arg Gin Leu Val Pro Phe Arg Gly Ser Gin Gin Thr Gin 
115 120 125 

cag ttg aag cag aag get cag att etc cct aac gta tgc aac ctt caa 432 
Gin Leu Lys Gin Lys Ala Gin lie Leu Pro Asn Val Cys Asn Leu Gin 
130 135 140 

tea aga cga tgt gaa ate gga ace ate acc acc ace gtc ace gag age 480 
Ser Arg Arg Cys Glu lie Gly Thr lie Thr Thr Thr Val Thr Glu Ser 
145 150 155 160 

aat ate gat ate ccc ttc cgt gac agg ccc ttt ggc act gga tea caa 528 
Asn lie Asp lie Pro Phe Arg Asp Arg Pro Phe Gly Thr Gly Ser Gin 
165 170 ~ 175' 

cag tgc aga gaa act gaa ate caa cga ccc gtt ggt gaa tgc caa agg 576 
Gin Cys Arg Glu Thr Glu lie Gin Arg Pro Val Gly Glu Cys Gin Arg 
180 185 190 

ttc gtg gag cag caa atg cag cag tct ccg agg tec act aga cca tac 624 
Phe Val Glu Gin Gin Met Gin Gin Ser Pro Arg Ser Thr Arg Pro Tyr 
195 200 2 05 

caa cag egg cca gga caa cag cag cag cag cag aga ggg etc caa caa 672 
Gin Gin Arg Pro Gly Gin Gin Gin Gin Gin Gin Arg Gly Leu Gin Gin 
210 215 220 

caa tgc tgc aac gag eta caa aac gtg aag agg gag tgt cat tgc gag 720 
Gin Cys Cys Asn Glu Leu Gin Asn Val Lys .Arg Glu Cys His Cys Glu 
225 230 235 240 

gca att caa gaa gtg get agg aga gtg atg agg cag cca cag cag cag 7 68 
Ala lie Gin Glu Val Ala Arg Arg Val Met Arg Gin Pro Gin Gin Gin 
245 250 255 

cag cag caa cgt cgt. ggg cag ttc ggt ggg cag gag atg gaa acc gcg 816 
Gin Gin Gin Arg Arg Gly Gin Phe Gly Gly Gin Glu Met Glu Thr Ala 
260 265 270 

agg agg gtg att cag aat ctg ccc aac cag tgc gac ttg gaa gtc cag 864 
Arg Arg Val He Gin Asn Leu Pro Asn Gin Cys Asp Leu Glu Val Gin 
275 280 * 285 

caa tgc aca acc tgt acg gga tga 888 
Gin Cys Thr Thr Cys Thr Gly 
290 295 

<210> 50 
<211> 295 
<212> PRT 

<213> Helianthus annuus 
<400> 50 

Met Ala Lys Gin He Val Leu Ala Leu Ala Phe Ala Ala Leu Val Ala 
15 10 15 

Phe Ala Thr Ala His Thr Thr He He Thr Thr Thr He Glu Asp Glu 
20 25 30 
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Asn Pro lie Ser Gly Gin Arg Gin Val Ser Gin Arg lie Gin Gly Gin 
35 40 45 

Arg Leu Asn Gin Cys Arg Met Phe Leu Gin Gin Gly Gin Asn lie Pro 
50 55 60 

Arg Glu Phe Asp Asn Pro Gin Met Gly Arg Gin Gin Glu Gin Gin Leu 
65 70 75 80 

Gin Gin Cys Cys Gin Glu Leu Gin Asn lie Glu Gly Gin Cys Gin Cys 
85 90 95 

Glu Ala Val Lys Gin Val Phe Arg Glu Ala Gin Gin Gin Val Gin Gin 
100 105 110 

Gin Gin Gly Arg Gin Leu Val . Pro Phe Arg Gly Ser Gin Gin Thr Gin 
115 120 125 

Gin Leu Lys Gin Lys Ala Gin lie Leu Pro Asn Val Cys Asn Leu Gin 
130 135 140 

Ser Arg Arg Cys Glu lie Gly Thr lie Thr Thr Thr Val Thr Glu Ser 
145 150 155 160 

Asn lie Asp lie Pro Phe Arg Asp Arg Pro Phe Gly Thr Gly Ser Gin 
165 170 175 

Gin Cys Arg Glu Thr Glu lie Gin Arg Pro Val Gly Glu Cys Gin Arg 
180 185 190 

Phe Val Glu Gin Gin Met Gin Gin Ser Pro Arg Ser Thr Arg Pro Tyr 
195 200 *" 205 

Gin Gin Arg Pro Gly Gin Gin Gin Gin Gin Gin Arg Gly Leu Gin Gin 
210 215 220 

Gin Cys Cys Asn Glu Leu Gin Asn Val Lys Arg Glu Cys His Cys Glu 
225 230 235 240 

Ala lie Gin Glu Val Ala Arg Arg Val Met Arg Gin Pro Gin Gin Gin 
245 250 255 

Gin Gin Gin Arg Arg Gly Gin Phe Gly Gly Gin Glu Met Glu Thr Ala 
260 265 270 

Arg Arg Val He Gin Asn Leu Pro Asn Gin Cys Asp Leu Glu Val Gin 
275 280 285 

Gin Cys Thr Thr Cys Thr Gly 
290 295 



<210> 51 
<211> 973 
<212> DNA 

<213> Helianthus annuus 

<220> 

<221> CDS 

<222> (2) . . (970) 

<223> coding for partial 2S albumine 
<400> 51 

g gca aag ata aca ctt etc ttg etc gee tta get get ctt gta gee ttg 49 
Ala Lys He Thr Leu Leu Leu Leu Ala Leu Ala Ala Leu Val Ala Leu 
15 10 15 

get aca gee cac aca acc ate ate acc ace acc ate gac gac gag aac 97 
Ala Thr Ala His Thr Thr He He Thr Thr Thr He Asp Asp Glu Asn 
20 25 30 
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ccg ate tec gaa caa agg caa tgt tgg caa cag gta cag gga caa agg 145 

Pro lie Ser Glu Gin Arg Gin Cys Trp Gin Gin Val Gin Gly Gin Arg 
35 40 45 

ttg aac cag tgt cgc atg ttc etc cag caa ggt cag agg ggg cag caa 193 
Leu Asn Gin Cys Arg Met Phe Leu Gin Gin Gly Gin Arg Gly Gin Gin 
50 55 60 

cac caa cag caa cag cat cag cag cag gag cag cag etc etc cag cag 241 
His Gin Gin Gin Gin His Gin Gin Gin Glu Gin Gin Leu Leu Gin Gin 
65 70 75 80 

tgt tgt caa gag ctt caa aac ate gaa gga cag tgc caa tgt gag gcg 289 
Cys Cys Gin Glu Leu Gin Asn lie Glu Gly Gin Cys Gin Cys Glu Ala 
85 90 95 

gtg aag cag gtg gtc cga gat get cag cga cac gag caa cag cga ccg 337 
Val Lys Gin Val Val Arg Asp Ala Gin Arg His Glu Gin Gin Arg Pro 
100 105 no 

cga gtg ccc ttc cag ggt tct cag cag tct caa cag ttg aag cag agg 385 
Arg Val Pro Phe Gin Gly Ser Gin Gin Ser Gin Gin Leu Lys Gin Arg 
115 120 125 

get cag att etc cct aac gta tgc aac ctt caa tea aga cga tgc gaa 433 
Ala Gin. lie Leu Pro Asn Val Cys Asn Leu Gin Ser Arg Arg Cys Glu 
130 135 140 

ate gaa age gtc agg agt gtt get gag age aat ttt gaa ate cca ttt 481 
lie Glu Ser Val Arg Ser Val Ala Glu Ser Asn Phe Glu He Pro Phe 
145 150 155 160 

gat atg ccg ttt gat ate cct tgg ccc ttt cgc cca age tea gag tea 529 
Asp Met Pro Phe Asp He Pro Trp Pro Phe Arg Pro Ser Ser Glu Ser 
165 170 175 

cag caa tgc aga cag agt gaa ate caa agg cct gtg agt cag tgc caa 577 
Gin Gin Cys Arg Gin Ser Glu He Gin Arg Pro Val Ser Gin Cys Gin 
180 185 190 

agg tat gtg gag cag caa att cag tec tec agg cca tac caa cag age 625 
Arg Tyr Val Glu Gin Gin He Gin Ser Ser Arg Pro Tyr Gin Gin Ser 
195 200 205 

ccg tac gac egg agg caa cag age cca tac gac egg agg caa cag age 673 
Pro Tyr Asp Arg Arg Gin Gin Ser Pro Tyr Asp Arg Arg .Gin Gin Ser 
210 215 220 

cca tat gaa cag agg caa gga cca tac gaa cag agg cca tac gaa cag 721 
Pro Tyr Glu Gin Arg Gin Gly Pro Tyr Glu Gin Arg Pro Tyr Glu Gin 
225 230 235 " 240 

agg cca tac caa cag cga gga gga cga cag cag gag cag caa ggg etc 769 
Arg Pro Tyr Gin Gin Arg Gly Gly Arg Gin Gin Glu Gin Gin Gly Leu 
245 250 255 

cag caa tgc tgc aac gag etc caa aac gtg agg agg gag tgt cag tgc 817 
Gin Gin Cys Cys Asn Glu Leu Gin Asn Val Arg Arg Glu Cys Gin Cys 
260 265 " 270 

gag gcg att aag gaa gtg ggc caa aga atg agg cag cag caa caa caa 865 
Glu Ala He Lys Glu Val Gly Gin Arg Met Arg Gin Gin Gin Gin Gin 
275 280 285 

caa cgt agg cag tat ggt ggg cag cag aca caa act gtg gag aga att 913 
Gin Arg Arg Gin Tyr Gly Gly Gin Gin Thr Gin Thr Val Glu Arg He 
290 295 300 
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ctt gag aat.ctg cct aac caa tgc gac eta gat gtc cag caa .tgc aac 961 

Leu Glu Asn Leu Pro Asn Gin Cys Asp Leu Asp Val Gin Gin Cys Asn 
305 310 315 320 

ate ccc tac tga 973 
lie Pro Tyr 

<210> 52 
<211> 323 
<212> PRT 

<213> Helianthus annuus 
<400> 52 

Ala Lys lie Thr Leu Leu Leu Leu Ala Leu Ala Ala Leu Val Ala Leu 
15 10 15 

Ala Thr Ala His Thr Thr He He Thr Thr Thr He Asp Asp Glu Asn 
20 25 30 

Pro He Ser Glu Gin Arg Gin Cys Trp Gin Gin Val Gin Gly Gin Arg 
35 40 45 

Leu Asn Gin Cys Arg Met Phe Leu Gin Gin Gly Gin Arg Gly Gin Gin 
50 55 60 

His Gin Gin Gin Gin His Gin Gin Gin Glu Gin Gin Leu Leu Gin Gin 
65 70 75 80 

Cys Cys Gin Glu Leu Gin Asn He Glu Gly Gin Cys Gin Cys Glu Ala 
85 90 95 

Val Lys Gin Val Val Arg Asp Ala Gin Arg His Glu Gin Gin Arg Pro 
100 105 110 

Arg Val Pro Phe Gin Gly Ser Gin Gin Ser Gin Gin Leu Lys Gin Arg 
115 120 125 

Ala Gin He Leu Pro Asn Val Cys Asn Leu Gin Ser Arg Arg Cys Glu 
130 135 140 

He Glu Ser Val Arg Ser Val Ala Glu Ser Asn Phe Glu He Pro Phe 
145 150 155 160 

Asp Met Pro Phe Asp He Pro Trp Pro Phe Arg Pro Ser Ser Glu Ser 
165 170 175 

Gin Gin Cys Arg Gin Ser Glu He Gin Arg Pro Val Ser Gin Cys Gin 
180 185 190 

Arg Tyr Val Glu Gin Gin He Gin Ser Ser Arg Pro Tyr Gin Gin Ser 
195 200 205 

Pro Tyr Asp Arg Arg Gin Gin Ser Pro Tyr Asp Arg Arg Gin Gin Ser 
210 215 220 

Pro Tyr Glu Gin Arg Gin Gly Pro Tyr Glu Gin Arg Pro Tyr Glu Gin 
225 230 235 240 

Arg Pro Tyr Gin Gin Arg Gly Gly Arg Gin Gin Glu Gin Gin Gly Leu 
245 250 255 

Gin Gin Cys Cys Asn Glu Leu Gin Asn Val Arg Arg Glu Cys Gin Cys 
2 60 265 270 

Glu Ala He Lys Glu Val Gly Gin Arg Met Arg Gin Gin Gin Gin Gin 
275 280 285 

Gin Arg Arg Gin Tyr Gly Gly Gin Gin Thr Gin Thr Val Glu Arg He 
290 295 300 



WO 03/078629 




PCT/EP03/02735 



Leu Glu Asn Leu Pro Asn Gin Cys Asp Leu Asp Val Gin Gin Cys Asn 
305 310 315 320 

lie Pro Tyr 



<210> 53 
<211> 1114 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : DNA 
construct coding for dsRNA 

<400> 53 

ggccgcgtgt tccatttggc cggaaacaac cagcagggag gctttggcgg ttcacagcaa 60 
caacaagaac agaaaaactt gtggagcggg ttcgacgcac aggtcatagc tcaagcattg 120 
aaaattgacg ttcagttggc tcagcagctt cagaaccaac aagacagcag aggaaacatc 180 
gttcgtgtta agggaccttt ccaggtcgtg aggccacctc taagacagcc ctacgagagc 240 
gaggagtgga gacacccacg tagcccacag ggcaacggcc ttgaggagac tatctgcagc 300 
atgaggtccc acgagaacat tgacgaccct gctcgtgctg acgtgtacaa gcccagccta 360 
ggtcgcgtga ccagcgtcaa cagctatacc ttgcccatct tggagtatgt caggctcagt 420 
gccactcgtg gcgttctcca gggtggatcc ttctgtaaca tttgacaaaa catgtgaaca 480 
cgtcatccgt catatagaac ttccaatttt aatatgtttt gctaaagaaa aaaaaaagga 540 
ataaatatct atcaaattca tttttaaaac atttgtatac gttcttaaat aatttaggat 600 
atgactaatt tttctttttg gtaaaaatgt taatatctat atttaattta ttaagaaaaa 660 
tgtacttaca ccctggagaa cgccacgagt ggcactgagc ctgacatact ccaagatggg 720 
caaggtatag ctgttgacgc tggtcacgcg acctaggctg ggcttgtaca cgtcagcacg 7 80 
agcagggtcg tcaatgttct cgtgggacct catgctgcag atagtctcct caaggccgtt 840 
gccctgtggg ctacgtgggt gtctccactc ctcgctctcg tagggctgtc ttagaggtgg 900 
cctcacgacc tggaaaggtc ccttaacacg aacgatgttt cctctgctgt cttgttggtt 960 
ctgaagctgc tgagccaact gaacgtcaat tttcaatgct tgagctatga cctgtgcgtc 1020 
gaacccgctc cacaagtttt tctgttcttg ttgttgctgt gaaccgccaa agcctccctg 1080 
ctggttgttt ccggccaaat ggaacacgcg gccg 1114 

<210> 54 
<211> 1114 
<212> RNA 

<213> Kttnstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: RNA sequence 
for forming dsRNA 

<400> 54 

ggccgcgugu uccauuuggc cggaaacaac cagcagggag gcuuuggcgg uucacagcaa 60 
caacaagaac agaaaaacuu guggagcggg uucgacgcac aggucauagc ucaagcauug 120 
aaaauugacg uucaguuggc ucagcagcuu cagaaccaac aagacagcag aggaaacauc 180 
guucguguua agggaccuuu ccaggucgug aggccaccuc uaagacagcc cuacgagagc 240 
gaggagugga gacacccacg uagcccacag ggcaacggcc uugaggagac uaucugcagc 300 
augagguccc acgagaacau ugacgacccu gcucgugcug acguguacaa gcccagccua 360 
ggucgcguga ccagcgucaa cagcuauacc uugcccaucu uggaguaugu caggcucagu 420 
gccacucgug gcguucucca ggguggaucc uucuguaaca uuugacaaaa caugugaaca 480 
cgucauccgu cauauagaac uuccaauuuu aauauguuuu gcuaaagaaa aaaaaaagga 540 
auaaauaucu aucaaauuca uuuuuaaaac auuuguauac guucuuaaau aauuuaggau 600 
augacuaauu uuucuuuuug guaaaaaugu uaauaucuau auuuaauuua uuaagaaaaa 660 
uguacuuaca cccuggagaa cgccacgagu ggcacugagc cugacauacu ccaagauggg 720 
caagguauag cuguugacgc uggucacgcg accuaggcug ggcuuguaca cgucagcacg 780 
agcagggucg ucaauguucu cgugggaccu caugcugcag auagucuccu caaggccguu 840 
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gcccuguggg cuacgugggu gucuccacuc cucgcucucg uagggcuguc uuagaggugg 900 

ccucacgacc uggaaagguc ccuuaacacg aacgauguuu ccucugcugu cuuguugguu 960 

cugaagcugc ugagccaacu gaacgucaau uuucaaugcu ugagcuauga ccugugcguc 1020 

gaacccgcuc cacaaguuuu ucruguucuug uuguugcugu gaaccgccaa agccucccug 1080 

cugguuguuu ccggccaaau ggaacacgcg gccg 1114 

<210> 55 
<211> 1789 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiiastlichen Sequenz: DNA 
construct coding for dsRNA 

<400> 55 

gcggccgcgg atcctcaggg tcttttcttg cccactttct tgaacgccgg caaactcacg 60 

tttgttgttc acggaagggg tctaatggga agagttattc cgggatgcgc cgagacgttc 120 

atggagtcac cggtatttgg agaaggtcaa ggtcagggtc agagtcaagg gttccgtgac 180 

atgcaccaga aagtagagca cctacggtgc ggtgacacca ttgcaacacc atctggtgta 240 

gctcaatggt tctacaacaa tgga^atgag cctctcattc ttgttgcagc cgcggatctc 300 

gccagcaacc agaaccagct tgaccgcaac cttagaccat ttttgatagc cggaaacaac 360 

ccacaagggc aggaatggct acaaggccga aagcaacaga agcaaaacaa catcttcaat 420 

ggcttcgcac ctgagatctt ggctcaagcc ttcaagatca atgtcgagac ggctcagcag 480 

ctccagaacc agcaagataa ccgtggcaac atcgtcaagg tcaacggacc tttcggcgtc 540 

attaggccac ccttgagacg cggcgaaggc ggccaacaac cacatgaaat agctaatggt 600 

ttagaggaga ctttgtgcac catgcgatgc actgaaaacc tcgatgaccc gtcggatgct 660 

gacgtgtaca agccatcact cggatacatt agcacactta acagctacaa tcttcctatc 720 

ctcagacttc tccgccttag cgctcttcgt ggctccatcc gtaaaactcg aggtaagctc 780 

aacaaatctt tagaaaatta attttatgtg acatatgcaa taatttgatt tggcaagata 840 

aactaataga ttttgcgatt tggagtttta aactctaaat aatctaaatc gttttcaatt 900 

ggtttaaata tatatcttgc atttttaatc gtttttaatt aaaaaatata tatatatata 960 

tatatcttgc atttttaatc gttttcaatt taaaaaatat cttgcacgca gaacgctgtc 1020 

gagttttacg gatggagcca cgaagagcgc taaggcggag aagtctgagg ataggaagat 1080 

tgtagctgtt aagtgtgcta atgtatccga gtgatggctt gtacacgtca gcatccgacg 1140 

ggtcatcgag gttttcagtg catcgcatgg tgcacaaagt ctcctctaaa ccattagcta 1200 

tttcatgtgg ttgttggccg ccttcgccgc gtctcaaggg tggcctaatg acgccgaaag 1260 

gtccgttgac cttgacgatg ttgccacggt tatcttgctg gttctggagc tgctgagccg 1320 

tctcgacatt gatcttgaag gcttgagcca agatctcagg tgcgaagcca ttgaagatgt 1380 

tgttttgctt ctgttgcttt cggccttgta gccattcctg cccttgtggg ttgtttccgg 1440 

ctatcaaaaa tggtctaagg ttgcggtcaa gctggttctg gttgctggcg agatccgcgg 1500 

ctgcaacaag aatgagaggc tcatttccat tgttgtagaa ccattgagct acaccagatg 1560 

gtgttgcaat ggtgtcaccg caccgtaggt gctctacttt ctggtgcatg tcacggaacc 1620 

cttgactctg accctgacct tgaccttctc caaataccgg tgactccatg aacgtctcgg 1680 

cgcatcccgg aataactctt cccattagac cccttccgtg aacaacaaac -gtgagtttgc 1740 

cggcgttcaa gaaagtgggc aagaaaagac cctgaggatc cgcggccgc 1789 

<210> 56 
<211> 1789 
<212> RNA 

<213> KQnstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: : RNA 
sequence for forming dsRNA 

<400> 56 

gcggccgcgg auccucaggg ucuuuucuug cccacuuucu ugaacgccgg caaacucacg 60 

uuuguuguuc acggaagggg ucuaauggga agaguuauuc cgggaugcgc cgagacguuc 120 

auggagucac cgguauuugg agaaggucaa ggucaggguc agagucaagg guuccgugac 180 

augcaccaga aaguagagca ccuacggugc ggugacacca uugcaacacc aucuggugua 240 




WO 03/078629 VP PCT/EP03/02735 

62 

gcucaauggu ucuacaacaa uggaaaugag ccucucauuc uuguugcagc cgcggaucuc 300 
gccagcaacc agaaccagcu ugaccgcaac cuuagaccau uuuugauagc cggaaacaac 360 
ccacaagggc aggaauggcu acaaggccga aagcaacaga agcaaaacaa caucuucaau 420 
ggcuucgcac cugagaucuu ggcucaagcc uucaagauca augucgagac ggcucagcag 480 
cuccagaacc agcaagauaa ccguggcaac aucgucaagg ucaacggacc uuucggcguc 540 
auuaggccac ccuugagacg cggcgaaggc ggccaacaac cacaugaaau agcuaauggu" 600 
uuagaggaga cuuugugcac caugcgaugc acugaaaacc ucgaugaccc gucggaugcu 660 
gacguguaca agccaucacu cggauacauu agcacacuua acagcuacaa ucuuccuauc 720 
cucagacuuc uccgccuuag cgcucuucgu ggcuccaucc guaaaacucg agguaagcuc 780 
aacaaaucuu uagaaaauua auuuuaugug acauaugcaa uaauuugauu uggcaagaua 840 
aacuaauaga uuuugcgauu uggaguuuua aacucuaaau aaucuaaauc guuuucaauu 900 
gguuuaaaua uauaucuugc auuuuuaauc guuuuuaauu aaaaaauaua uauauauaua 960 
uauaucuugc auuuuuaauc * guuuucaauu uaaaaaauau cuugcacgca gaacgcuguc 1020 
gaguuuuacg gauggagcca cgaagagcgc uaaggcggag aagucugagg auaggaagau 1080 
uguagcuguu aagugugcua auguauccga gugauggcuu guacacguca gcauccgacg 1140 
ggucaucgag guuuucagug caucgcaugg ugcacaaagu cuccucuaaa ccauuagcua 1200 
uuucaugugg uuguuggccg ccuucgccgc gucucaaggg uggccuaaug acgccgaaag 1260 
guccguugac cuugacgaug uugccacggu uaucuugcug guucuggagc ugcugagccg 1320 
ucucgacauu gaucuugaag gcuugagcca agaucucagg ugcgaagcca uugaagaugu 1380 
uguuuugcuu cuguugcuuu cggccuugua gccauuccug cccuuguggg uuguuuccgg 1440 
cuaucaaaaa uggucuaagg uugcggucaa gcugguucug guugcuggcg agauccgcgg 1500 
cugcaacaag aaugagaggc ucauuuccau uguuguagaa ccauugagcu acaccagaug 1560 
guguugcaau ggugucaccg caccguaggu gcucuacuuu cuggugcaug ucacggaacc 1620 
cuugacucug acccugaccu ugaccuucuc caaauaccgg ugacuccaug aacgucucgg 1680 
cgcaucccgg aauaacucuu cccauuagac cccuuccgug aacaacaaac gugaguuugc 1740 
cggcguucaa gaaagugggc aagaaaagac ccugaggauc cgcggccgc 1789 

<210> 57 
<211> 1273 
<212> DNA 

<213> Klinstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: DNA 
construct coding for dsRNA 

<400> 57 

gcggccgcgg atccatggct aacaagctct tcctcgtctg cgcaactctc gccctctgct 60 
tcctcctcac caacgcttcc atctaccgca ccgttgtcga attcgaagaa gatgacgcca 120 
gcaaccccgt aggtccaaga cagagatgcc agaaggagtt tcagcaatca.caacacctaa 180 
gagcttgcca gagatggatg agcaagcaaa tgaggcaagg acgtggtggt ggtccttccc 240 
tcgacgatga gttcgatttc gagggccccc agcagggata ccagctactc cagcagtgct 300 
gcaacgagct tcgccaggaa gagccagttt gcgtttgccc caccttgaaa caagctgcca 360 
gggcagttag cctccaggga cagcacggac cattccaatc caggaaaatt taccagtcag 420 
ctaagtactt gcctaacatt tgcaagatcc agcaagttgg tgaatgtccc ttccagacca 480 
ccatcccttt cttccctcct tactactagg gtactcgagg taagctcaac aaatctttag 540 
aaaattaatt ttatgtgaca tatgcaataa tttgatttgg caagataaac taatagattt 600 
tgcgatttgg agttttaaac tctaaataat ctaaatcgtt ttcaattggt ttaaatatat 660 
atcttgcatt tttaatcgtt tttaattaaa aaatatatat atatatatat atcttgcatt 720 
tttaatcgtt ttcaatttaa aaaatatctt gcacgcagaa cgctgtcgac taccctagta 780 
gtaaggaggg aagaaaggga tggtggtctg gaagggacat tcaccaactt gctggatctt 840 
gcaaatgtta ggcaagtact tagctgactg gtaaattttc ctggattgga atggtccgtg 90Q 
ctgtccctgg aggctaactg ccctggcagc ttgtttcaag gtggggcaaa cgcaaactgg 960 
ctcttcctgg cgaagctcgt tgcagcactg ctggagtagc tggtatccct gctgggggcc 1020 
ctcgaaatcg aactcatcgt cgagggaagg accaccacca cgtccttgcc tcatttgctt 1080 
gctcatccat ctctggcaag ctcttaggtg ttgtgattgc tgaaactcct tctggcatct 1140 
ctgtcttgga cctacggggt tgctggcgtc atcttcttcg aattcgacaa cggtgcggta 1200 
gatggaagcg ttggtgagga ggaagcagag ggcgagagtt gcgcagacga ggaagagctt 1260 
gttagccatg gat 12 73 
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<210> 58 

<211> 1273 

<212> RNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: : RNA 
sequence for forming dsRNA 

<400> 58 
gcggccgcgg 
uccuccucac 
gcaaccccgu 
gagcuugcca 
ucgacgauga 
gcaacgagcu 
gggcaguuag 
cuaaguacuu 
ccaucccuuu 
aaaauuaauu 
ugcgauuugg 
aucuugcauu 
uuuaaucguu 
guaaggaggg 
gcaaauguua 
cugucccugg 
cucuuccugg 
cucgaaaucg 
gcucauccau 
cugucuugga 
gauggaagcg 
guuagccaug 

<210> 59 
<211> 1575 
<212> DNA 
<213> Arabidopsis thaliana 

<220> 

<221> CDS 

<222> (1) . . (1572) 

<223> 12S cruciferin- 

<400> 59 

atg gtt aag etc age aat etc etc gtt gca acc ttc ggg gtt etc etc 48 

Met Val Lys Leu Ser Asn Leu Leu Val Ala Thr Phe Gly Val Leu Leu 

15 10 15 

gtc ctt aac ggc tgc ctt gcg agg cag tea ctt ggg gtt cct cct cag 96 
Val Leu Asn Gly Cys Leu Ala Arg Gin Ser Leu Gly Val Pro Pro Gin 
20 25 30 

eta cag aac gag tgt aac etc gac aac eta gat gtt etc caa gee acc 144 
Leu Gin Asn Glu Cys Asn Leu Asp Asn Leu Asp Val Leu Gin Ala Thr 
35 40 45 

gaa act ate aag agt gaa gee ggt cag ate gag tac tgg gac cac aac 192 
Glu Thr lie Lys Ser Glu Ala Gly Gin lie Glu Tyr Trp Asp His Asn 
50 55 60 

cac cct cag etc cga tgt gtt ggt gtt tec gtt get cgt tat gta att 240 
His Pro Gin Leu Arg Cys Val Gly Val Ser Val Ala Arg Tyr Val He 
65 70 75 80 



auccauggcu aacaagcucu uccucgucug cgcaacucuc gcccucugcu 60 
caacgcuucc aucuaccgca ccguugucga auucgaagaa gaugacgeca 120 
aggxiccaaga cagagaugee agaaggaguu ucagcaauca caacaccuaa 180 
gagauggaug agcaagcaaa ugaggcaagg acgugguggu gguccuuccc 240 
guucgauuuc gagggccccc agcagggaua ccagcuacuc cagcagugcu 300 
ucgccaggaa gagecaguuu gcguuugccc caccuugaaa caagcugcca 360 
ccuccaggga cagcacggac cauuccaauc caggaaaauu uaccagucag 420 
gecuaacauu ugcaagaucc agcaaguugg ugaauguccc uuccagacca 480 
cuucccuccu uacuacuagg guacucgagg uaagcucaac aaaucuuuag 540 
uuaugugaca uaugcaauaa uuugauuugg caagauaaac uaauagauuu 600 
aguuuuaaac ucuaaauaau cuaaaucguu uucaauuggu uuaaauauau 660 
-uuuaaucguu uuuaauuaaa aaauauauau auauauauau aucuugcauu 720 
uucaauuuaa aaaauaucuu geaegcagaa cgcugucgac uacccuagua 780 
aagaaaggga ugguggucug gaagggacau ucaccaacuu gcuggaucuu 840 
ggcaaguacu uagcugacug guaaauuuuc cuggauugga augguccgug 900 
aggcuaacug cccuggcagc uuguuucaag guggggcaaa cgcaaacugg 960 
cgaagcucgu ugcagcacug cuggaguagc ugguaucccu gcugggggee 1020 
aacucaucgu cgagggaagg accaccacca cguccuugcc ucauuugcuu 1080 
cucuggcaag cucuuaggug uugugauugc ugaaacuccu ucuggcaucu 1140 
ecuaeggggu ugcuggegue aucuueuueg aauucgacaa eggugeggua 1200 
uuggugagga ggaagcagag ggcgagaguu gegcagaega ggaagagcuu 1260 
gau 1273 
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gaa caa ggc ggt ctt tac ttg ccc acc ttc ttc act tec cca aaa att 288 

Glu Gin Gly Gly Leu Tyr Leu Pro Thr Phe Phe Thr Ser Pro Lys lie 
85 .90 95 

tec tac gtc gtt caa gga acg ggt ate age gga aga gtg gtc cct gga 336 
Ser Tyr Val Val Gin Gly Thr Gly lie Ser Gly Arg Val Val Pro Gly 
100 105 110 

egt gec gag acc ttc atg gac teg cag ccg atg caa gga caa caa caa 384 
Cys Ala Glu Thr Phe Met Asp Ser Gin Pro Met Gin Gly Gin Gin Gin 
115 120 125 

ggc caa cca tgg caa gga cga cag gga caa caa ggc caa cca tgg gaa 432 
Gly Gin .Pro Trp Gin Gly Arg Gin Gly Gin Gin Gly Gin Pro Trp Glu 
130 .135 140 

gga cag gga caa cag gga caa caa gga aga caa ggc caa cca tgg gaa 480 
Gly Gin Gly Gin Gin Gly Gin Gin Gly Arg Gin Gly Gin Pro Trp Glu 
.145 150 155 160 

gga cag gga caa cag gga caa caa gga cga cag gga caa caa ggc caa 528 ■ 
Gly Gin Gly Gin Gin Gly Gin Gin Gly Arg' Gin Gly Gin Gin Gly Gin 
165 170 175 

cca tgg gaa gga cag gga cag cag gga caa caa ggg ttc cgt gac atg 576 
Pro Trp Glu Gly Gin Gly Gin Gin Gly Gin Gin Gly Phe Arg Asp Met 
180 185 190 

cac cag aag gtg gaa cat gtg aga cgc gga gac gtc ttt gee aac act 624 
His Gin Lys Val Glu His Val Arg Arg Gly Asp Val Phe Ala Asn Thr 
195 200 205 

cca ggc tct gec cac tgg ate tac aac tea gga gaa cag cca ctt gtc 672 
Pro Gly Ser Ala His Trp lie Tyr Asn Ser Gly Glu Gin Pro Leu Val 
210 215 220 

ate ate get ctt etc gac ate gec aac tac caa aac caa etc gac cgc 720 
lie lie Ala Leu Leu Asp lie Ala Asn Tyr Gin Asn Gin Leu Asp Arg 
225 230 235 240 

aac cct aga gtg ttc cat ttg gee gga aac aac cag cag gga ggc ttt 768 
Asn Pro Arg Val Phe His Leu Ala Gly Asn Asn Gin Gin Gly Gly Phe 
245 250 ' 255 

ggc ggt tea cag caa caa caa gaa cag aaa aac ttg tgg age ggg ttc 816 
Gly Gly Ser Gin Gin Gin Gin Glu Gin Lys Asn Leu Trp Ser Gly Phe 
260 265 270 

gac gca cag gtc ata get caa gca ttg aaa att gac gtt cag ttg get 864 
Asp Ala Gin Val lie Ala Gin Ala Leu Lys lie Asp Val Gin Leu Ala 
275 280 285 

cag cag ctt cag aac caa caa gac age aga gga aac ate gtt cgt gtt 912 
Gin Gin Leu Gin Asn Gin Gin Asp Ser Arg Gly Asn He Val Arg Val 
290 295 300 

aag gga cct ttc cag gtc gtg agg cca cct eta aga cag ccc tac gag 960 
Lys Gly Pro Phe Gin Val Val Arg Pro Pro Leu Arg Gin Pro Tyr Glu 
305 310 315 ~ " 320 

age gag gag tgg aga cac cca cgt age cca cag ggc aac ggc ctt gag 1008 
Ser Glu Glu Trp Arg His Pro Arg Ser Pro Gin Gly Asn Gly Leu Glu 
325 330 335 

gag act ate tgc age atg agg tec cac gag aac att gac gac cct get 1056 
Glu Thr He Cys Ser Met Arg Ser His Glu Asn He Asp Asp Pro Ala 
340 345 350 
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cgt get gac gtg tac aag ccc age eta ggt cgc gtg ace age gtc aac 1104 
Arg Ala Asp Val Tyr Lys Pro Ser Leu Gly Arg Val Thr Ser Val Asn 
355 360 365 

age tat acc ttg ccc ate ttg gag tat gtc agg etc agt gee act cgt 1152 
Ser Tyr Thr Leu Pro lie Leu Glu Tyr Val Arg Leu Ser Ala Thr Arg 
370 375 380 

ggc gtt etc cag ggt aat gcg atg gtg ctt cct aaa tac aac atg aac 1200 
Gly Val Leu Gin Gly Asn Ala Met Val Leu Pro Lys Tyr Asn Met Asn 
385 390 395 400 

get aac gag ate ttg tac tgc act gga gga caa gga agg ate caa gtg 1248 
Ala Asn Glu lie Leu Tyr Cys Thr Gly Gly Gin Gly Arg lie Gin Val 
405 410 ~ ~ 415 

gtc aac gac aac gga cag aac gtg ttg gac caa cag gtg cag aag gga 1296 
Val Asn Asp Asn Gly Gin Asn Val Leu Asp Gin Gin Val Gin Lys Gly 
420 425 430 

cag etc gtg gtc. ate cca caa ggg ttc gca tac gtt gtc cag tec cac 1344 
Gin Leu Val Val lie Pro Gin Gly Phe Ala Tyr Val Val Gin Ser His 
435 440 445 

gga aac aag ttc gag tgg ate tct ttc aaa act aat gaa aac gca atg 1392 
Gly Asn Lys Phe Glu Trp lie Ser Phe Lys Thr Asn Glu Asn Ala Met 
450 455 460 

' ate age act ttg gcg ggt aga acc teg etc ttg agg gca ttg cca ttg 1440 
lie Ser Thr Leu Ala Gly Arg Thr Ser Leu Leu Arg Ala Leu Pro Leu 
465 470 475 480 

gag gtc ata tea aat ggt ttc cag ate tct ccc gag gaa get agg aag 1488 
Glu Val lie Ser Asn Gly Phe Gin He Ser Pro Glu Glu Ala Arg Lys 
485 490 495 

ate aag ttc aac aca ctt gag acc act ttg acc cgc get gee ggt agg 1536 
He Lys Phe Asn Thr Leu Glu Thr Thr Leu Thr Arg Ala Ala Gly Arg 
500 505 510 

caa caa caa cag ttg ate gag gag att gtc gag get taa 1575 
Gin Gin Gin Gin Leu He Glu Glu He Val Glu Ala 
515 520 

<210> 60 
<2U> 524 
<212> PRT 

<213> Arabidopsis thaliana 
<400> 60 

Met Val Lys Leu Ser Asn Leu Leu Val Ala Thr Phe Gly Val Leu Leu 
15 10 15 

Val Leu Asn Gly Cys Leu Ala Arg Gin Ser Leu Gly Val Pro Pro Gin 
20 25 30 

Leu Gin Asn Glu Cys Asn Leu Asp Asn Leu Asp Val Leu Gin Ala Thr 
35 40 45 

Glu Thr He Lys Ser Glu Ala Gly Gin He Glu Tyr Trp Asp His Asn 
50 55 60 

His Pro Gin Leu Arg Cys Val Gly Val Ser Val Ala Arg Tyr Val He 
65 70 75 80 



Glu Gin Gly Gly Leu Tyr Leu Pro Thr Phe Phe Thr Ser Pro Lys He 
85 90 95 
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Ser Tyr Val Val Gin Gly Thr Gly He Ser Gly Arg Val Val Pro Gly 
100 105 HO 

Cys Ala Glu Thr Phe Met Asp Ser Gin Pro Met Gin Gly Gin Gin Gin 
115 120 125 

Gly Gin Pro Trp Gin Gly Arg Gin Gly Gin Gin Gly Gin Pro Trp Glu 
130 135 140 

Gly Gin Gly Gin Gin Gly Gin Gin Gly Arg Gin Gly Gin Pro Trp Glu 
145 150 155 160 

Gly Gin Gly Gin Gin Gly Gin Gin Gly Arg Gin Gly Gin Gin Gly Gin 
165 170 175 

Pro Trp Glu Gly Gin Gly Gin Gin Gly Gin Gin Gly Phe Arg Asp Met 
180 185 ■ 190 

His Gin Lys Val Glu His Val Arg Arg Gly Asp Val Phe Ala Asn Thr 
195 200 205 

Pro Gly Ser Ala His Trp He Tyr Asn Ser Gly Glu Gin Pro Leu Val 
210 215 220 

He He Ala Leu Leu Asp He Ala Asn Tyr Gin Asn Gin Leu Asp Arg 
225 230 235 240 

Asn Pro Arg Val Phe His Leu Ala Gly Asn Asn Gin Gin Gly Gly Phe 
245 250 255 

Gly Gly Ser Gin Gin Gin Gin Glu Gin Lys Asn Leu Trp Ser Gly Phe 
260 • 265 270 

Asp Ala Gin Val He Ala Gin Ala Leu Lys He Asp Val Gin Leu Ala 
275 280 ~ 285 

Gin Gin Leu Gin Asn Gin Gin Asp Ser Arg Gly Asn He Val Arg Val 
290 295 300- 

Lys Gly Pro Phe Gin Val Val Arg Pro Pro Leu Arg Gin Pro Tyr Glu 
305 310 315 320 

Ser Glu Glu Trp Arg His Pro Arg Ser. Pro Gin Gly Asn Gly Leu Glu 
325 330 ~ 335 

Glu Thr He Cys Ser Met Arg Ser His Glu Asn He Asp Asp Pro Ala 
340 345 ~ 350 

Arg Ala Asp Val Tyr Lys Pro Ser Leu Gly Arg Val Thr Ser Val Asn 
355 3 60 365 

Ser Tyr Thr Leu Pro He Leu Glu Tyr Val Arg Leu Ser Ala Thr Arg 
370 375 380 

Gly Val Leu Gin Gly Asn Ala Met Val Leu Pro Lys Tyr Asn Met Asn 
385 390 395 * 400 

Ala Asn Glu He Leu Tyr Cys Thr Gly Gly Gin Gly Arg He Gin Val 
405 410 ~ ~ 415 " 

Val Asn Asp Asn Gly Gin Asn Val Leu Asp Gin Gin Val Gin Lys Gly 
420 425 430 

Gin Leu Val Val He Pro Gin Gly Phe Ala Tyr Val Val Gin Ser His 
435 440 445 

Gly Asn Lys Phe Glu Trp He Ser Phe Lys Thr Asn Glu Asn Ala Met 
450 455 460 

He Ser Thr Leu Ala Gly Arg Thr Ser Leu Leu Arg Ala Leu Pro Leu 
465 470 475 480 
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Glu Val He Ser Asn Gly Phe Gin He Ser Pro Glu Glu Ala Arg Lys 
485 490 495 

He Lys Phe Asn Thr Leu Glu Thr Thr Leu Thr Arg Ala Ala Gly Arg 
500 505 510 

Gin Gin Gin Gin Leu He Glu Glu He Val Glu Ala 
515 520 

<210> 61 
<211> 1419 
<212> DNA 

<213> Arabidopsis thaliana 

<220> 

<221> CDS 

<222> (1) . . (1416) 

<223> 12S Cral storage protein 

<400> 61 

atg get cga gtc tct tct ctt ctt tct ttc tgc tta aca ctt ttg ate 48 
Met Ala Arg Val Ser Ser Leu Leu Ser Phe Cys Leu Thr Leu Leu He 
1 5 10 15 

ctt ttc cat ggc tac gcg get caa cag ggt cag cag ggt cag cag ttt 96 
Leu Phe His Gly Tyr Ala Ala Gin Gin Gly Gin Gin Gly Gin Gin Ph'e 
20 25 30 

ccg aac gag tgc cag etc gac cag etc aat gcg etc gag ccg tea cac 144 
Pro Asn Glu Cys Gin Leu Asp Gin Leu Asn Ala Leu Glu Pro Ser His 
35 40 45 

gta ctg aag age gag get ggt cgc ate gag gtg tgg gac cac cac get 192 
Val Leu Lys Ser Glu Ala Gly Arg He Glu Val Trp Asp His His Ala 
50 55 60 

cct cag etc cgt tgc tea ggt gtc tec ttt gca cgt tac ate ate gag 240 
Pro Gin Leu Arg Cys Ser Gly Val Ser Phe Ala Arg Tyr He He Glu 
65 70 75 80 

tct aag ggt etc tac ttg ccc tct ttc ttt aac ace gcg aag etc tct 2 88 
Ser Lys Gly Leu Tyr Leu Pro Ser Phe Phe Asn Thr Ala Lys Leu Ser 
85 90 95 

ttc gtg get aag gga cga ggt ctt atg gga aaa gtg ate cct gga tgc 336 
Phe Val Ala Lys Gly Arg Gly Leu Met Gly Lys Val ile Pro Gly Cys 
100 105 110 

gec gaa aca ttc caa gac tea tea gag ttc caa cca cgc ttc gaa ggt 384 
Ala Glu Thr Phe Gin Asp Ser Ser Glu Phe Gin Pro Arg Phe Glu Gly 
115 120 125 

caa ggt caa age cag agg ttc cgt gac atg cac cag aaa gtg gag cac 432 
Gin Gly Gin Ser Gin Arg Phe Arg Asp Met His Gin Lys Val Glu His 
130 135 140 

att agg age ggt gat acc att gee aca aca ccc ggt gta gca cag tgg 480 
Ile Arg Ser Gly Asp Thr Ile Ala Thr Thr Pro Gly Val Ala Gin Trp 
145 150 155 160 

ttc tac aac gac gga cag cag cca ctt gtc ate gtc age gtc ttc gat 528 
Phe Tyr Asn Asp Gly Gin Gin Pro Leu Val Ile Val Ser Val Phe Asp 
165 170 175 

eta gee agt cac cag aac cag ctt gac cgc aac cca agg cca ttt tac 576 
Leu Ala Ser His Gin Asn Gin Leu Asp Arg Asn Pro Arg Pro Phe Tyr 
180 185 190 
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tta gcc gga aac aac cca caa ggt caa gta tgg eta caa gga cga gag 624 
Leu Ala Gly Asn Asn Pro Gin Gly Gin Val Trp Leu Gin Gly Arg Glu 
195 200 205 

caa cag cca cag aag aac att ttc aat gga ttt gga ccc gag gtt att 672 

Gin Gin Pro Gin Lys Asn lie Phe Asn Gly Phe Gly Pro Glu Val lie 
210 215 220 

get caa get ttg aag ate gat ctt cag aca gca cag caa ctt cag aac 720 

Ala Gin Ala Leu Lys lie Asp Leu Gin Thr Ala Gin Gin Leu Gin Asn 

225 230 235 240 

caa gat gac aac cgt gga aac att gtc cga gtc caa gga ccg ttc ggt 768 

Gin Asp Asp Asn Arg Gly Asn lie Val Arg Val Gin Gly Pro Phe Gly 
245 250 255 

gtc att agg ccg cct ttg agg ggc cag aga cct cag gag gag gaa gaa 816 

Val lie Arg Pro Pro Leu Arg Gly Gin Arg Pro Gin Glu Glu Glu Glu 
260 265 270 

gaa gaa gga cga cat gga cga cac ggt aat ggc tta gag gag acc ate 864 

Glu Glu Gly Arg His Gly Arg His Gly Asn Gly Leu Glu Glu Thr lie 
275 280 285 

tgc age gcc agg tgc acc gat aac etc gat gac ccg tct cgt get gac* 912 

Cys Ser Ala Arg Cys Thr Asp Asn Leu Asp Asp Pro Ser Arg Ala Asp 
290 295 300 

gtg tac aag cca cag etc ggt tac ate age act etc aac agt tac gat 960 
Val Tyr Lys Pro Gin Leu Gly Tyr lie Ser Thr Leu Asn Ser Tyr Asp 

305 ^ 310 315 320 

etc ccc att ctt cgc ttc ate cgt etc tea gcc etc cgt gga tct ate 1008 

Leu Pro lie Leu Arg Phe lie Arg Leu Ser Ala Leu Arg Gly Ser lie 
325 330 335 

cgt caa aac gca atg gtg ctt cca cag tgg aac gca aac gcg aac get 1056 

Arg Gin Asn Ala Met Val Leu Pro Gin Trp Asn Ala Asn Ala Asn Ala 
340 345 350 

att ctt tac gag aca gac ggg gaa gcc caa ate cag ate gta aac gac 1104 

lie Leu Tyr .Glu Thr Asp Gly Glu Ala Gin lie Gin lie Val Asn Asp 
355 360 365 

aat ggt aac aga gtg ttt gac gga caa gtc tct caa gga cag etc ata 1152 

Asn Gly Asn Arg Val Phe Asp Gly Gin Val Ser Gin Gly Gin Leu lie 
370 375 380 

gcc gta cca caa ggt ttc teg gtg gtg aaa cgc gca aca age aac cga 1200 

Ala Val Pro Gin Gly Phe Ser Val Val Lys Arg Ala Thr Ser Asn Arg 

385 390 395 400 

ttc cag tgg gtt gag ttc aaa aca aac get aac gcg caa ate aac act 1248 

Phe Gin Trp Val Glu Phe Lys Thr Asn Ala Asn Ala Gin lie Asn Thr 
405 410 415 

ctg gcg gga cga acc tea gtc ttg aga ggt tta cca ctt gaa gtc ata 1296 

Leu Ala Gly Arg Thr Ser Val Leu Arg Gly Leu Pro Leu Glu Val lie 
420 425 430 

acc aat ggg ttc caa ate tea ccc gaa gaa gca agg agg gtc aag ttc 1344 

Thr Asn Gly Phe Gin lie Ser Pro Glu Glu Ala Arg Arg Val Lys Phe 
435 440 445 

aac acg etc gag acc act ttg act cac age agt ggc cca get age tac 1392 

Asn Thr Leu Glu Thr Thr Leu Thr His Ser Ser Gly Pro Ala Ser Tyr 
450 455 460 
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gga agg cca aga gtg get gca 
Gly Arg Pro Arg Val Ala Ala 
465' 470 



get 
Ala 



taa 



1419 



<210> 62 
<211> 472 
<212> PRT 

<213> Arabidopsis thaliana 
<400> 62 

Met Ala Arg Val Ser Ser Leu Leu Ser Phe Cys Leu Thr Leu Leu lie 
15 10 15 

Leu Phe .His Gly Tyr Ala Ala Gin Gin Gly Gin Gin Gly Gin Gin Phe 
20 25 30 

Pro Asn Glu Cys Gin Leu Asp Gin Leu Asn Ala Leu Glu Pro Ser His 
35 40 45 

Val Leu Lys Ser Glu Ala Gly Arg lie Glu Val Trp Asp His His Ala 
50 55 60 

Pro Gin Leu Arg Cys Ser Gly Val Ser Phe Ala Arg Tyr lie lie Glu 
65 70 75 80 

Ser Lys Gly Leu Tyr Leu Pro Ser Phe Phe Asn Thr Ala Lys Leu Ser 
85 90 95 

Phe Val Ala Lys Gly Arg Gly Leu Met Gly Lys Val He Pro Gly Cys 
100 105 110 

Ala Glu Thr Phe Gin Asp Ser Ser Glu. Phe Gin Pro Arg Phe Glu Gly 
115 120 125 

Gin Gly Gin Ser Gin Arg Phe Arg Asp Met His Gin Lys Val Glu His 
130 135 140 

He Arg Ser Gly Asp Thr He Ala Thr Thr Pro Gly Val Ala Gin Trp 
145 150 155 160 

Phe Tyr Asn Asp Gly Gin Gin Pro Leu Val He Val Ser Val Phe Asp 
165 170 175 

Leu Ala Ser His Gin Asn Gin Leu Asp Arg Asn Pro Arg Pro Phe Tyr 
180 185 190 

Leu Ala Gly Asn Asn Pro Gin Gly Gin Val Trp Leu Gin Gly Arg Glu 
195 200 205 

Gin Gin Pro Gin Lys Asn He Phe Asn Gly Phe Gly Pro Glu Val He 
210 215 220 

Ala Gin Ala Leu Lys He Asp Leu Gin Thr Ala Gin Gin Leu Gin Asn 
225 230 235 240 

Gin Asp Asp Asn Arg Gly Asn He Val Arg Val Gin Gly Pro Phe Gly 
245 250 255 

Val He Arg Pro Pro Leu Arg Gly Gin Arg Pro Gin Glu Glu Glu Glu 
260 265 270 

Glu Glu Gly Arg His Gly Arg His Gly Asn Gly Leu Glu Glu Thr He 
275 280 285 

Cys Ser Ala Arg Cys Thr Asp Asn Leu Asp Asp Pro Ser Arg Ala Asp 
290 295 300 

Val Tyr Lys Pro Gin Leu Gly Tyr He Ser Thr Leu Asn Ser Tyr Asp 
305 310 315 320 
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Leu Pro lie Leu Arg Phe lie Arg Leu Ser Ala Leu Arg Gly Ser lie 
325 330 335 

Arg Gin Asn Ala Met Val Leu Pro Gin Trp Asn Ala Asn Ala Asn Ala 
340 345 350 

lie Leu Tyr Glu Thr Asp Gly Glu Ala Gin lie Gin lie Val Asn Asp 
355 360 365 

" Asn Gly Asn Arg Val Phe Asp Gly Gin Val Ser Gin Gly Gin Leu lie 
370 375 380 

Ala Val Pro Gin Gly Phe Ser Val Val Lys Arg Ala Thr Ser Asn Arg 
385 390 395 400 

Phe Gin Trp Val Glu Phe Lys Thr Asn Ala Asn Ala Gin lie Asn Thr 
405 410 415 

Leu Ala Gly Arg Thr Ser Val Leu Arg Gly Leu Pro Leu Glu Val lie 
420 425 430 

Thr Asn Gly Phe Gin lie Ser Pro Glu Glu Ala Arg Arg Val Lys Phe 

435 440 445 

Asn Thr Leu Glu Thr Thr Leu Thr His Ser Ser Gly Pro Ala Ser Tyr 
450 455 460 

Gly Arg Pro Arg Val Ala Ala Ala 
465 470 

<210> 63 

<211> 1419 

.<212> DNA 

<213> Arabidopsis thaliana 

<220> 
<221> CDS 
<222> (1)..(1416) 

<223> At5g442120/MLN1_4 storage protein 
<400> 63 

atg get cga gtc tct tct ctt ctt tct ttc tgc tta aca ctt ttg ate 
Met Ala Arg Val Ser Ser Leu Leu Ser Phe Cys Leu Thr Leu Leu lie 

15 10 15 

ctt ttc cat ggc tac gcg get caa cag ggt cag cag ggt cag cag ttt 96 
Leu Phe His Gly Tyr Ala Ala Gin Gin Gly Gin Gin Gly Gin Gin Phe 
20 25 30 

ccg aac gag tgc cag etc gac cag etc aat gcg etc gag ccg tea cac 
Pro Asn Glu Cys Gin Leu Asp Gin Leu Asn Ala Leu Glu Pro Ser His 

35 " 40 45 

gta ctg aag age gag get ggt cgc ate gag gtg tgg gac cac cac get 192 
Val Leu Lys Ser Glu Ala Gly Arg lie Glu Val Trp Asp His His Ala 

50 55 60 

cct cag etc cgt tgc tea ggt gtc tec ttt gca cgt tac ate ate gag 240 
Pro Gin Leu Arg Cys Ser Gly Val Ser Phe Ala Arg Tyr lie lie Glu 
65 70 75 80 

tct aag ggt etc tac ttg ccc tct ttc ttt aac acc gcg aag etc tct 288 
Ser Lys Gly Leu Tyr Leu Pro Ser Phe Phe Asn Thr Ala Lys Leu Ser 
85 90 95 

ttc gtg get aag gga cga ggt ctt atg gga aaa gtg ate cct gga tgc 336 
Phe Val Ala Lys Gly Arg Gly Leu Met Gly Lys Val lie Pro Gly Cys 
100 105 110 
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gcc gaa aca ttc caa gac tea tea gag ttc caa cca cgc ttc gaa ggt 384 
Ala Glu Thr Phe Gin Asp Ser Ser Glu Phe Gin Pro Arg Phe Glu Gly 
115 120 125 

caa ggt caa age cag agg ttc cgt gac atg cac cag aaa gtg gag cac 432 
Gin Gly Gin Ser Gin Arg Phe Arg Asp Met His Gin Lys Val Glu His 
130 135 140 

att agg age ggt gat ace att gcc aca aca ccc ggt gta gca cag tgg 480 
lie Arg Ser Gly Asp Thr lie Ala Thr Thr Pro Gly Val Ala Gin Trp 
145 150 155 160 

ttc tac aac gac gga cag gaa cca ctt gtc ate gtc age gtc ttc gat 528 
Phe Tyr Asn Asp Gly Gin Glu Pro Leu Val lie Val Ser Val Phe Asp 
165 170 175 

eta gcc agt cac cag aac cag ctt gac cgc aac cca agg cca ttt tac 576 
Leu Ala Ser His Gin Asn Gin Leu Asp Arg Asn Pro Arg Pro Phe Tyr 
180 185 190 

tta gcc gga aac aac cca caa ggt caa gta tgg eta caa gga cga gag 624 
Leu Ala Gly Asn Asn Pro Gin Gly Gin Val Trp Leu Gin Gly Arg Glu 
195 200 205 

caa cag cca cag aag aac att ttc aat gga ttt gga ccc gag gtt att 672 
Gin Gin Pro Gin Lys Asn He Phe Asn Gly Phe Gly Pro Glu Val He 
210 215 220 

get caa get ttg aag ate gat ctt cag aca gca cag caa ctt cag aac 720 
Ala Gin Ala Leu Lys He Asp Leu Gin Thr Ala Gin Gin Leu Gin Asn 
225 230 235 240 

caa gat gac aac cgt gga aac att gtc cga gtc caa gga ccg ttc ggt 768 
Gin Asp Asp Asn Arg Gly Asn He Val Arg Val Gin Gly Pro Phe Gly 
245 250 255 

gtc att agg ccg cct ttg agg ggc cag aga cct cag gag gag gaa gaa 816 
Val He Arg Pro Pro Leu Arg Gly Gin Arg Pro Gin Glu Glu Glu Glu 
260 265 270 

gaa gaa gga cga cat gga cga cac ggt aat ggc tta gag gag acc ate 864 
Glu Glu Gly Arg His Gly Arg His Gly Asn Gly Leu Glu Glu Thr He 
275 280 285 

tgc age gcc agg tgc acc gat aac etc gat gac ccg tct- cgt .get gac 912 
Cys Ser Ala Arg Cys Thr Asp Asn Leu Asp Asp Pro Ser Arg Ala Asp 
290 295 300 

gtg tac aag cca cag etc ggt tac ate age act etc aac agt tac gat 960 
Val Tyr Lys Pro Gin Leu Gly Tyr He Ser Thr Leu Asn Ser Tyr Asp 
305 310 315 320 

etc ccc ate ctt cgc ttc ate cgt etc tea gcc etc cgt gga tct ate 1008 
Leu Pro He Leu Arg Phe He Arg Leu Ser Ala Leu Arg Gly Ser He 
325 330 335 

cgt caa aac gca atg gtg ctt cca cag tgg aac gca aac gcg aac get 1056 
Arg Gin Asn Ala Met Val Leu Pro Gin Trp Asn Ala Asn Ala Asn Ala 
340 345 350 

att ctt tac gtg aca gac ggg gaa gcc caa ate cag ate gta aac gac 1104 
He Leu Tyr Val Thr Asp Gly Glu Ala Gin He Gin He Val Asn Asp 
355 360 365 

aat ggt aac aga gtg ttt gac gga caa gtc tct caa gga cag etc ata 1152 
Asn Gly Asn Arg Val Phe Asp Gly Gin Val Ser Gin Gly Gin Leu He 
370 375 380 
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gcc gta cca caa ggt ttc teg gtg gtg aaa cgc gca aca age aac cga 1200 
Ala Val Pro Gin Gly Phe Ser Val Val Lys Arg Ala Thr Ser Asn Arg 
385 390 395 400 

ttc cag tgg gtt gag ttc aaa aca aac get aac gcg caa ate aac act 1248 
Phe Gin Trp Val Glu Phe Lys Thr Asn Ala Asn Ala 'Gin lie .Asn Thr 
405 410 415 

ctg gcg gga cga ace tea gtc ttg aga ggt tta cca ctt gaa gtc ata 1296 
Leu Ala Gly Arg Thr Ser Val Leu Arg Gly Leu Pro Leu Glu Val lie 
420 425 430 ■ 

acc aat ggg ttc caa ate tea ccc gaa gaa gca agg agg gtc aag ttc* 1344 
Thr Asn Gly Phe Gin lie Ser Pro Glu Glu Ala Arg Arg Val Lys Phe 
435 440 b 445 

aac acg etc gag acc act ttg act cac age agt ggc cca get age tac 1392 
Asn Thr Leu Glu Thr Thr Leu Thr His Ser Ser Gly Pro Ala Ser Tyr 
450 455 460 

gga agg cca agg gtg get gca get taa 1419 
Gly Arg Pro Arg Val Ala Ala Ala 
465 470 

<210> 64 

<211> 472 

<212> PRT 

<213> Arabidopsis thaliana 

<400> 64 

Met Ala Arg Val Ser Ser Leu Leu Ser Phe Cys Leu Thr Leu Leu lie 
1 5 10 15 

Leu Phe His Gly Tyr Ala Ala Gin Gin Gly Gin Gin Gly Gin Gin Phe 
20 25 30 

Pro Asn Glu Cys Gin Leu Asp Gin Leu Asn Ala Leu Glu Pro Ser His 
35 40 45 

Val Leu Lys Ser Glu Ala Gly Arg lie Glu Val Trp Asp His His Ala 
50 . 55 60 

Pro Gin Leu Arg Cys Ser Gly Val Ser Phe Ala Arg Tyr lie lie Glu 
65 70 75 80 

Ser Lys Gly Leu Tyr Leu Pro Ser Phe Phe Asn Thr Ala Lys Leu Ser 
85 90 95 

Phe Val Ala Lys Gly Arg Gly Leu Met Gly Lys Val lie Pro Gly Cys 
100 105 110 

Ala Glu Thr Phe Gin Asp Ser Ser Glu Phe Gin Pro Arg Phe Glu Gly 
115 120 125 

Gin Gly Gin Ser Gin Arg Phe Arg Asp Met His Gin Lys Val Glu His 
130 135 140 

lie Arg Ser Gly Asp Thr He Ala Thr Thr Pro Gly Val Ala Gin Trp 
145 150 155 160 

Phe Tyr Asn Asp Gly Gin Glu Pro Leu Val He Val Ser Val Phe Asp 
165 170 175 

Leu Ala Ser His Gin Asn Gin Leu Asp Arg Asn Pro Arg Pro Phe Tyr 
180 185 190 



Leu Ala Gly Asn Asn Pro 
195 



Gin Gly Gin Val Trp Leu Gin Gly Arg Glu 
200 205 
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Gin Gin Pro Gin Lys Asn He Phe Asn Gly Phe Gly Pro Glu Val He 
210 215 220 

Ala Gin Ala Leu Lys He Asp Leu Gin Thr Ala Gin Gin Leu Gin Asn 
225 230 235 240 

Gin Asp Asp Asn Arg Gly Asn He Val Arg Val Gin Gly Pro Phe Gly 

245 250 ~ 255 

Val He Arg Pro Pro Leu Arg Gly Gin Arg Pro Gin Glu Glu Glu Glu 

260 265 270 

Glu Glu Gly Arg His Gly Arg His Gly Asn Gly Leu Glu Glu Thr He 
275 280 285 

Cys Ser Ala Arg Cys Thr Asp Asn Leu Asp Asp Pro Ser Arg Ala Asp 
290 295 300 

Val Tyr Lys Pro Gin Leu Gly Tyr He Ser Thr Leu Asn Ser Tyr Asp 
305 310 315 320 

Leu Pro lie Leu Arg Phe He Arg Leu Ser Ala Leu Arg Gly Ser He 

325 330 335 

Arg Gin Asn Ala Met Val Leu Pro Gin Trp Asn Ala Asn Ala Asn Ala 

340 345 350 

He Leu Tyr Val Thr Asp Gly Glu Ala Gin He Gin He Val Asn Asp 
355 360 365 

Asn Gly Asn Arg Val Phe Asp Gly Gin Val Ser Gin Gly Gin Leu He 
370 375 380 

Ala Val Pro Gin Gly Phe Ser Val Val Lys Arg Ala Thr Ser Asn Arg 
385 390 395 400 

Phe Gin Trp Val Glu Phe Lys Thr Asn Ala Asn Ala Gin He Asn Thr 

405 410 415 

Leu Ala Gly Arg Thr Ser Val Leu Arg Gly Leu Pro Leu Glu Val He 

420 425 430 

Thr Asn Gly Phe Gin He Ser Pro Glu Glu Ala Arg Arg Val Lys Phe 
435 440 445 

Asn Thr Leu Glu Thr Thr Leu Thr His Ser Ser Gly Pro Ala Ser Tyr 
450 455 460 

Gly Arg Pro Arg Val Ala Ala Ala 
465 470 



<210> 65 
<211> 1368 
<212> DNA 

<213> Arabidopsis thaliana 

<220> 

<221> CDS 

<222> (1) . . (1365) 

<223> 12S Crb storage protein 

<400> 65 

atg ggt cga gtc tea tct att ate tct ttc tct ttg aca etc ttg ate 48 

Met Gly Arg Val Ser Ser He He Ser Phe Ser Leu Thr Leu Leu He 
15 10 15 

etc ttc aat ggc tac act gee caa cag tgg ccc aac gag tgc cag etc 96 
Leu Phe Asn Gly Tyr Thr Ala Gin Gin Trp Pro Asn Glu Cys Gin Leu 
20 25 30 
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gat caa etc aat gcg etc gaa cca tec caa ate ate aag age gag ggt 144 

Asp Gin Leu Asn Ala Leu Glu Pro Ser Gin lie He Lys Ser Glu Gly 
35 40 45 

ggt cgc ate gag gtc tgg gac cac cat gca ccc cag etc cgt tgc tec 192 
Gly Arg He Glu Val Trp Asp His His Ala Pro Gin Leu Arg Cys Ser 
50 55 60 

ggc ttt gee ttt gag cgt ttc gtc att gag cct cag ggt ctt ttc ttg 240 
Gly Phe Ala Phe Glu Arg Phe Val He Glu Pro Gin Gly Leu Phe Leu 
65 70 75 80 

ccc act ttc ttg aac gee ggc aaa etc acg ttt gtt gtt cac gga agg 288 
Pro Thr Phe Leu Asn Ala Gly Lys Leu Thr Phe Val Val His Gly Arg 
85 90 95 

ggt eta atg gga aga gtt att ccg gga tgc gee gag acg ttc atg gag 336 
Gly Leu Met Gly Arg Val He Pro Gly Cys Ala Glu Thr Phe Met Glu 
100 105 110 

tea ccg gta ttt gga gaa ggt caa ggt cag ggt cag agt caa ggg ttc 384 
Ser Pro Val Phe Gly Glu Gly Gin Gly Gin Gly Gin Ser Gin Gly Phe 
115 " 120 125 

cgt gac atg cac cag aaa gta gag cac eta egg tgc ggt gac ace att 432 
Arg Asp Met His Gin Lys Val Glu His Leu Arg Cys Gly Asp Thr He 
130 135 140 

gca aca cca tct ggt gta get caa tgg ttc tac aac aat gga aat gag 480 
Ala Thr Pro Ser Gly Val Ala Gin Trp Phe Tyr Asn Asn Gly Asn Glu 
145 150 155 160 

cct etc att ctt gtt gca gec gcg gat etc gee age aac cag aac cag 
Pro Leu He Leu Val Ala Ala Ala Asp Leu Ala Ser Asn Gin Asn Gin 
165 170 175 

ctt gac cgc aac ctt aga cca ttt ttg ata gee gga aac aac cca caa 
Leu Asp Arg Asn Leu Arg Pro Phe Leu He Ala Gly Asn Asn Pro Gin 
180 185 190 

ggg cag gaa tgg eta caa ggc cga aag caa cag aag caa aac aac ate 624 
Gly Gin Glu Trp Leu Gin Gly Arg Lys Gin Gin Lys Gin Asn Asn He 
195 200 205 

ttc aat ggc ttc gca cct gag ate ttg get caa gee ttc aag ate aat 672 
Phe Asn Gly Phe Ala Pro Glu He Leu Ala Gin Ala Phe Lys. He Asn 

210 215 220 

gtc gag acg get cag cag etc cag aac cag caa gat aac cgt ggc aac 720 
Val Glu Thr Ala Gin Gin Leu Gin Asn Gin Gin Asp Asn Arg Gly Asn 
225 230 235 240 

ate gtc aag gtc aac gga cct ttc ggc gtc att agg cca ccc ttg aga 768 
He Val Lys Val Asn Gly Pro Phe Gly Val He Arg Pro Pro Leu Arg 
245 250 255 

cgc ggc gaa ggc ggc caa caa cca cat gaa ata get aat ggt tta gag 816 
Arg Gly Glu Gly Gly Gin Gin Pro His Glu He Ala Asn Gly Leu Glu 
"^260 265 270 

gag act ttg tgc ace atg cga tgc act gaa aac etc gat gac ccg teg 864 
Glu Thr Leu Cys Thr Met Arg Cys Thr Glu Asn Leu Asp Asp Pro Ser 
275 " 280 285 

gat get gac gtg tac aag cca tea etc gga tac att age aca ctt aac 912 
Asp Ala Asp Val Tyr Lys Pro Ser Leu Gly Tyr He Ser Thr Leu Asn 
290 295 300 



528 



576 
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age tac aat ctt cct ate etc aga ctt etc cgc ctt age get ctt cgt 960 

Ser Tyr Asn Leu Pro lie Leu Arg Leu Leu Arg Leu Ser Ala Leu Arg 
305 310 315 320 

ggc tec ate cgt aaa aac get atg gtg eta ccg caa tgg aac gta aac 1008 
Gly Ser lie Arg Lys Asn Ala Met Val Leu Pro Gin Trp Asn Val Asn 
325 330 335 

gca aac gcg gca etc tac gtg aca aac gga aag get cat ata caa atg 1056 
Ala Asn Ala Ala Leu Tyr Val Thr Asn Gly Lys Ala His lie Gin Met 
340 345 350 

gtg aac gac aac gga gaa aga gtg ttc gac caa gag ate tec age gga 1104 
Val Asn Asp Asn Gly Glu Arg Val Phe Asp Gin Glu lie Ser Ser Gly 
355 360 365 

cag tta eta gtc gtg cca caa ggc ttt teg gtc atg aaa cat cgc ata 1152 
Gin Leu Leu Val Val Pro Gin Gly Phe Ser Val Met Lys His Arg lie 
370 375 380 

ggc gaa cag ttc gag tgg ate gaa ttc aag aca aac gaa aac gca cag 1200 
Gly Glu Gin Phe Glu Trp. lie Glu Phe Lys Thr Asn Glu Asn Ala Gin 
385 390 395 400 

gtc aac aca etc gcg ggc cgt ace tea gtc atg aga ggt ttg ccg ctt 1248 
Val Asn Thr Leu Ala Gly Arg Thr Ser Val Met Arg Gly Leu Pro Leu 
405 410 415 

gag gtt ata ace aat ggg tac cag ate tct ccc gaa gaa get aaa cga 1296 
Glu Val lie Thr Asn Gly Tyr Gin lie Ser Pro Glu Glu Ala Lys Arg 
420 425 430 

' gta aag ttt age acg att gag ace aca ctg acc cat age agt cca atg 1344 
Val Lys Phe Ser Thr He Glu Thr Thr Leu Thr His Ser Ser Pro Met 
435 440 445 

age tac gga agg cct agg get tga 13 68 

Ser Tyr Gly Arg Pro Arg Ala 
450 455 

<210> 66 
<211> 455 

<212> PRT • ■ 

<213> Arabidopsis thaliana 

<400> 66 

Met Gly Arg Val Ser Ser He He Ser Phe Ser Leu Thr Leu Leu He 
15 10 15 

Leu Phe Asn Gly Tyr Thr Ala Gin Gin Trp Pro Asn Glu Cys Gin Leu 
20 25 30 

Asp Gin Leu Asn Ala Leu Glu Pro Ser Gin He He Lys Ser Glu Gly 
35 40 45 

Gly Arg He Glu Val Trp Asp His His Ala Pro Gin Leu Arg Cys Ser 
50 55 60 

Gly Phe Ala Phe Glu Arg Phe Val He Glu Pro Gin Gly Leu Phe Leu 
65 70 75 80 

Pro Thr Phe Leu Asn Ala Gly Lys Leu Thr Phe Val Val His Gly Arg 
85 90 95 

Gly Leu Met Gly Arg Val He Pro Gly Cys Ala Glu Thr Phe Met Glu 
100 105 110 

Ser Pro Val Phe Gly Glu Gly Gin Gly Gin Gly Gin Ser Gin Gly Phe 
115 120 125 
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Arg Asp Met His Gin Lys Val Glu His Leu Arg Cys Gly Asp Thr He 
130 135 140 

Ala Thr Pro Ser Gly Val Ala Gin Trp Phe Tyr Asn Asn Gly Asn Glu 
145 150 155 160 

Pro Leu He Leu Val Ala Ala Ala Asp Leu Ala Ser Asn Gin Asn Gin 
165 170 175 

Leu Asp Arg Asn Leu Arg Pro Phe Leu He Ala Gly Asn Asn Pro Gin 
180 185 190 

Gly Gin Glu Trp Leu Gin Gly Arg Lys Gin Gin Lys Gin Asn Asn He 
195 200 205 

Phe Asn Gly Phe Ala Pro Glu He Leu Ala Gin Ala Phe Lys He Asn 
210 215 220 

Val Glu Thr Ala Gin Gin Leu Gin Asn Gin Gin Asp Asn Arg Gly Asn 
225 230 235 240 

He Val Lys Val Asn Gly Pro Phe Gly Val He Arg Pro Pro Leu Arg 
245 250 255 

Arg Gly Glu Gly Gly Gin Gin Pro His Glu He Ala Asn Gly Leu Glu 
260 265 270 

Glu Thr Leu Cys Thr Met Arg Cys Thr Glu Asn Leu Asp Asp Pro Ser 
275 280 285 

Asp Ala Asp Val Tyr Lys Pro Ser Leu Gly Tyr He Ser Thr Leu Asn 
290 295 300 

Ser Tyr Asn Leu Pro He Leu Arg Leu Leu Arg Leu Ser Ala Leu Arg 
305 310 315 320 

Gly Ser He Arg Lys Asn Ala Met Val Leu Pro Gin Trp Asn Val Asn 
325 330 . 335 

Ala Asn Ala Ala Leu Tyr Val Thr Asn Gly Lys Ala His He Gin Met 
340 345 350 

Val Asn Asp Asn Gly Glu Arg Val Phe Asp Gin Glu He Ser Ser Gly 
355 360 365 

Gin Leu Leu Val Val Pro Gin Gly Phe Ser Val Met Lys His Arg He 
370 375 380 

Gly Glu Gin Phe Glu Trp He Glu Phe Lys Thr Asn Glu Asn Ala Gin 
385 390 395 400 

Val Asn Thr Leu Ala Gly Arg Thr Ser Val Met Arg Gly Leu Pro Leu 
405 410 415 

Glu Val lie Thr Asn Gly Tyr Gin He Ser Pro Glu Glu Ala Lys Arg 
420 425 430 

Val Lys Phe Ser Thr He Glu Thr Thr Leu Thr His Ser Ser Pro Met 
435 440 445 

Ser Tyr Gly Arg Pro Arg Ala 
450 455 



<210> 67 
<211> 1356 
<212> DNA 

<213> Arabidopsis thaliana 
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<220> 

<221> CDS 

<222> (1) . . (1353) 

<223> putative 12S storage protein 
<400> 67 

atg cat aag ctt ttg ttt tct ctt etc tec gtc gtc tea etc tea ttt 48 
Met His Lys Leu Leu Phe Ser Leu Leu Ser Val Val Ser Leu Ser Phe 

1 5 10 15 

etc etc ttc ttc cat ggc gec gag gca cgc cag cga gag gcg ccg ttt 96 
Leu Leu Phe Phe His Gly Ala Glu Ala Arg Gin Arg Glu Ala -Pro Phe 
20 25 30 

cca aac gec tgc cat ttc age caa ate aac age etc gcg ccc get cag 144 
Pro Asn Ala Cys His Phe Ser Gin lie Asn Ser Leu Ala Pro Ala Gin 
35 40 45 

gcg acg .aag ttc gaa gec ggt cag atg gaa gta tgg gac cac atg age 192 
Ala Thr Lys Phe Glu Ala Gly Gin Met Glu Val Trp Asp His Met Ser 
50 55 60 

cct gag etc cga tgc gec ggt gta acg gtg get cgc ate acc ctt cag 240 
Pro Glu Leu Arg Cys Ala Gly Val Thr Val Ala Arg lie Thr' Leu Gin 
65 70 75 80 

ccc aat tec att ttc ttg ccc get ttc ttt age cca cct gec ctt get 288 
Pro Asn Ser He Phe Leu Pro Ala Phe Phe Ser Pro Pro Ala Leu Ala 
85 90 . 95 

tac gtt gtc caa gga gaa gga gtt atg ggg acg att get tct ggt tgt 336 
Tyr Val Val Gin Gly Glii Gly Val Met Gly Thr He Ala Ser Gly Cys 
100 105 110 

cct gag act ttt gca gaa gtt gaa gga tea tea gga aga gga gga gga 384 
Pro Glu Thr Phe Ala Glu Val Glu Gly Ser Ser Gly Arg Gly Gly Gly 
115 120 125 

gga gac ccg ggt cga cgt ttt gag gac atg cac cag aag ttg gag aat 432 
Gly Asp Pro Gly Arg Arg Phe Glu Asp Met His Gin Lys Leu Glu Asn 
130 135 140 

ttc egg cga ggg gat gtg ttt get teg ctt gec gga gtt tea cag tgg 480 
Phe Arg Arg Gly Asp Val Phe Ala Ser Leu Ala Gly Val Ser Gin Trp 
145 150 155 160 

tgg tac aac cgc ggt gat tec gat gee gtc att gtc att gtt ctt gat 528 
Trp Tyr Asn Arg Gly Asp Ser Asp Ala Val He Val lie Val Leu Asp 
165 17.0 175' 

gtc acc aac aga gaa aac cag ctt gac caa gtc cct agg atg ttc caa 576 
Val Thr Asn Arg Glu Asn Gin Leu Asp Gin Val Pro Arg Met Phe Gin 
180 185 ~ 190 

eta gee ggg age aga acg caa gaa gaa gaa caa cca tta acg tgg cca 624 
Leu Ala Gly Ser Arg Thr Gin Glu Glu Glu Gin Pro Leu Thr Trp Pro 
195 200 205 

tea ggc aac aac get ttc age ggt ttc gac cca aac ata ate gcg gaa 672 
Ser Gly Asn Asn Ala Phe Ser Gly Phe Asp Pro Asn He He Ala Glu 
210 215 220 

gca ttc aaa ate aac ate gag aca get aag caa eta caa aac cag aag 720 
Ala Phe Lys He Asn He Glu Thr Ala Lys Gin Leu Gin Asn Gin Lys 
225 230 235 240 

gac aac aga gga aac ata ate cga gca aat ggt cct etc cat ttc gtc 768 
Asp Asn Arg Gly Asn He He Arg Ala Asn Gly Pro Leu His Phe Val 
245 250 255 
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ate cca ccg cct cgt gaa tgg cag caa gat ggc att get aat ggc ate 816 
lie Pro Pro Pro Arg Glu Trp Gin Gin Asp Gly lie Ala Asn Gly lie 
260 265 270 

gaa gag act tat tgc acg get aag att cat gag aat ate gat gat cca 864 
Glu Glu Thr Tyr Cys Thr Ala Lys lie His Glu Asn lie Asp Asp Pro 
275 280 285 

gaa egg -tct gac cat ttt age aca cga gee gga aga ate age act ctt 912 
Glu Arg Ser Asp His Phe Ser Thr Arg Ala Gly Arg lie Ser Thr Leu 
290 295 300 

aac age ctt aat etc cct gtt eta cgt eta gtc aga ctt aac gee ctt 960 
Asn Ser Leu Asn Leu Pro Val Leu Arg Leu Val Arg Leu Asn Ala Leu 
.305 310 315 " 320 

aga ggt tat etc tac age gga gga atg gtg ttg cca caa tgg acg gca 1008 
Arg Gly Tyr Leu Tyr Ser Gly Gly Met Val Leu Pro Gin Trp Thr Ala 
325 • 330 335 

aac gcg cac acg gtg eta tac gtc aca gga ggt caa gec aag ata caa 1056 
Asn Ala His Thr Val Leu Tyr Val Thr Gly Gly Gin Ala Lys He Gin 
340 345 350 

gtg gtg gac gac aat ggt cag teg gtg ttc aat gag caa gtg gga caa 1104 
Val Val Asp Asp Asn Gly Gin Ser Val Phe Asn Glu Gin Val Gly Gin 
355 360 365 

ggc caa ate att gtg att cca caa ggc ttt gca gtt tea aaa acg get 1152 
Gly Gin He He Val He Pro Gin Gly Phe Ala Val Ser Lys Thr Ala 
370 375 380 

ggt gaa acg ggt ttc gag tgg ata tea ttc aag aca aac gat aac get 1200 
Gly Glu Thr Gly Phe Glu Trp He Ser Phe Lys Thr Asn Asp Asn Ala 
385 390 395 400 

tac att aac aca ctg age ggc caa aca teg tac ttg aga gca gtt cca 1248 
Tyr He Asn Thr Leu Ser' Gly Gin Thr Ser Tyr Leu Arg Ala Val Pro 
405 410 415 

gtg gat gtg ate aaa gcg tea tat gga gtg aac gag gaa gaa gee aag 1296 
Val Asp Val He Lys Ala Ser Tyr Gly Val Asn Glu Glu Glu Ala Lys 
420 425 430 

agg ate aag ttt agt cag caa gag ace. atg ttg tct atg aca cca age 1344 
Arg He Lys Phe Ser Gin Gin Glu Thr Met Leu Ser Met Thr Pro Ser 
435 440 445 

tct tct tct taa 1356 
Ser Ser Ser 
450 

<210> 68 
<211> 451 
<212> PRT 

<213> Arabidopsis thaliana 
<400> 68 

Met His Lys Leu Leu Phe Ser Leu Leu Ser Val Val Ser Leu Ser Phe 
15 10 15 

Leu Leu Phe Phe His Gly Ala Glu Ala Arg Gin Arg Glu Ala Pro Phe 
20 25 30 

Pro Asn Ala Cys His Phe Ser Gin He Asn Ser Leu Ala Pro Ala Gin 
35 40 45 
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Ala Thr Lys Phe Glu Ala Gly Gin Met Glu Val Trp Asp His Met Ser 
50 55 60 

Pro Glu Leu Arg Cys Ala Gly Val Thr Val Ala Arg lie Thr Leu Gin 
65 70 75 80 

Pro Asn Ser lie Phe Leu Pro Ala Phe Phe Ser Pro Pro Ala Leu Ala 
85 90 95 

Tyr Val Val Gin Gly Glu Gly Val Met Gly Thr lie Ala Ser Gly Cys 
100 105 110 

Pro Glu Thr Phe Ala Glu Val Glu Gly Ser Ser Gly Arg Gly Gly Gly 
115 120 125 

Gly Asp Pro Gly Arg Arg Phe Glu Asp Met His Gin Lys Leu Glu Asn 
130 135 140 

Phe Arg Arg Gly Asp Val Phe Ala Ser Leu Ala Gly Val Ser Gin Trp 
145 150 155 160 

Trp Tyr Asn Arg Gly Asp Ser Asp Ala Val lie Val lie Val Leu Asp 
165 170 175 

Val Thr Asn Arg Glu Asn Gin Leu Asp' Gin Val Pro Arg Met Phe Gin 
180 185 . 190 

Leu Ala Gly Ser Arg Thr Gin Glu Glu Glu Gin Pro Leu Thr Trp Pro 
195 200 205 

Ser Gly Asn Asn Ala Phe Ser Gly Phe Asp Pro Asn lie lie Ala Glu 
210 215 220 

Ala Phe Lys lie Asn He Glu Thr Ala Lys Gin Leu Gin Asn Gin Lys 
225 230 235 240 

Asp Asn Arg Gly Asn He He Arg Ala Asn Gly Pro Leu His Phe Val 
245 250 255 

He Pro Pro Pro Arg Glu Trp Gin Gin Asp Gly He Ala Asn Gly He 
260 265 270 

Glu Glu Thr Tyr Cys Thr Ala Lys He His Glu Asn He Asp Asp Pro 
275' 280 285 

Glu Arg Ser Asp His Phe Ser Thr Arg Ala Gly Arg He Ser Thr Leu 
290 295 300 

Asn Ser Leu Asn Leu Pro Val Leu Arg Leu Val Arg Leu Asn Ala Leu 
305 310 315 " 320 

Arg Gly Tyr Leu Tyr Ser Gly Gly Met Val Leu Pro Gin Trp Thr Ala 
325 330 335 

Asn Ala His Thr Val Leu Tyr Val Thr Gly Gly Gin Ala Lys He Gin 
340 345 350 

Val Val Asp Asp Asn Gly Gin Ser Val Phe Asn Glu Gin Val Gly Gin 
355 360 365 ' 

Gly Gin He He Val He Pro Gin Gly Phe Ala Val Ser Lys Thr Ala 
370 375 380 

Gly Glu Thr Gly Phe Glu Trp He Ser Phe Lys Thr Asn Asp Asn Ala 
385 390 395 400 

Tyr He Asn Thr Leu Ser Gly Gin Thr Ser Tyr Leu Arg Ala Val Pro 
405 410 " 415 

Val Asp Val He Lys Ala Ser Tyr Gly Val Asn Glu Glu Glu Ala Lys 
420 425 430 
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Arg lie Lys Phe Ser Gin Gin Glu Thr Met Leu Ser Met Thr Pro Ser 
435 440 445 

•Ser Ser Ser 
450 



<210> 69 
<211> 1356 
<212> DNA 

<213> Arabidopsis thaliana 

<220> 

<221> CDS 

<222> (1) . . (1353) 

<223> 12S storage protein Atlg03890 
<400> 69 

atg cat aag ctt ttg ttt tct ctt etc tec gtc gtc tea etc tea ttt 48 
Met His Lys Leu Leu Phe Ser Leu Leu Ser Val Val Ser Leu Ser Phe 
1 5 10 ■ 15 

etc etc ttc ttc cat ggc gee gag gca cgc cag cga gag gcg ccg ttt 96 
Leu Leu Phe Phe His Gly Ala Glu Ala Arg Gin Arg Glu Ala Pro Phe 
20 25 30 

cca aac gee tgc cat ttc age caa ate aac age etc gcg ccc get cag 144 
Pro Asn Ala Cys His Phe Ser Gin lie Asn Ser Leu Ala Pro Ala Gin 
35 40 45 

gcg acg aag ttc gaa gee ggt cag atg gaa gta tgg gac cac atg age 192 
Ala Thr Lys Phe Glu Ala Gly Gin Met Glu Val Trp Asp His Met Ser 
50 55 . 60 

cct gag etc cga tgc gec ggt gta acg gtg get cgc ate acc ctt cag 240 
Pro Glu Leu Arg Cys Ala Gly Val Thr Val Ala Arg lie Thr Leu Gin 
65 70 75 80 

ccc aat tec att ttc ttg ccc get ttc ttt age cca cct gec ctt get 288 
Pro Asn Ser lie Phe Leu Pro Ala Phe Phe Ser Pro Pro Ala Leu Ala 
85 90 95 

tac gtt gtc caa gga gaa gga gtt atg ggg acg att get tct ggt tgt 336 
Tyr Val Val Gin Gly Glu Gly Val Met Gly Thr He Ala Ser Gly Cys 
100 105 110 

cct gag act ttt gca gaa gtt gaa gga tea tea gga aga gga gga gga 384 
Pro Glu Thr Phe Ala Glu Val Glu Gly Ser Ser Gly Arg Gly Gly Gly 
115 120 125 

gga gac ccg ggt cga cgt ttt gag gac atg cac cag aag ttg gag aat 432 
Gly Asp Pro Gly Arg Arg Phe Glu Asp Met His Gin. Lys Leu Glu Asn 
130 135 140 

ttc egg cga ggg gat gtg ttt get teg ctt gec gga gtt tea cag tgg 480 
Phe Arg Arg Gly Asp Val Phe Ala Ser Leu Ala Gly Val Ser Gin Trp 
145 150 155 160 

tgg tac aac cgc ggt gat tec gat gee gtc att gtc att gtt ctt gat 528 
Trp Tyr Asn Arg Gly Asp Ser Asp Ala Val He Val He Val Leu Asp 
165 170 175 

gtc acc aac aga gaa aac cag ctt gac caa gtc cct agg atg ttc caa 576 
Val Thr Asn Arg Glu Asn Gin Leu Asp Gin Val Pro Arg Met Phe Gin 
180 185 190 
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eta gec ggg age aga acg caa gaa gaa gaa caa cca tta acg tgg cca 624 

Leu Ala Gly Ser Arg Thr Gin Glu Glu Glu Gin Pro Leu Thr Trp Pro 
195 200 205 

tea ggc aac aac get ttc age ggt ttc gac cca aac ata ate gcg gaa 672 

Ser Gly Asn Asn Ala Phe Ser Gly Phe Asp Pro Asn lie lie Ala Glu 
210 215 220 

gca ttc aaa ate aac ate gag aca get aag caa eta caa aac cag aag 720 

Ala Phe Lys lie Asn lie Glu Thr Ala Lys Gin Leu Gin Asn Gin Lys 

225 230 235 240 

gac aac aga gga aac ata ate cga gca aat ggt cct etc cat ttc gtc 768 

Asp Asn Arg Gly Asn lie He Arg Ala Asn Gly Pro Leu His Phe Val 
245 250 255 

ate cca ccg cct cgt gaa tgg cag caa gat ggc att get aat ggc ate 816 

He Pro Pro Pro Arg Glu Trp Gin Gin Asp Gly He Ala Asn Gly He 
260 265 270 

gaa gag act tat tgc acg get aag att cat gag aat ate gat gat cca 864 

Glu Glu Thr Tyr Cys Thr Ala Lys He His Glu Asn He Asp Asp Pro 
275 280 285 

gaa egg tct gac cat ttt age aca cga gec gga aga ate age act ctt 912 

Glu Arg Ser Asp His Phe Ser Thr Arg Ala Gly Arg He Ser Thr Leu 
290 '295 300 

aac age ctt aat etc cct gtt eta cgt eta gtc aga ctt aac gee ctt 960 

Asn Ser Leu Asn Leu Pro Val Leu Arg Leu Val Arg Leu Asn Ala Leu 

305 310 315 320 

aga ggt tat etc tac age gga gga atg gtg ttg cca caa tgg acg gca 1008 

Arg Gly Tyr Leu Tyr Ser Gly Gly Met Val Leu Pro Gin Trp Thr Ala 
325 330 335 

aac gcg cac acg gtg eta tac gtc aca gga ggt caa gee aag ata caa 1056 

Asn Ala His Thr Val Leu Tyr Val Thr Gly Gly Gin Ala Lys He Gin 
340 345 350 

gtg gtg gac gac aat ggt cag teg gtg ttc aat gag caa gtg gga caa 1104 

Val Val Asp Asp Asn Gly Gin Ser Val Phe Asn Glu Gin Val Gly Gin 
355 360 365 

ggc caa ate att gtg att cca caa ggc ttt gca gtt tea aaa acg get 1152 

Gly Gin. He He Val He Pro Gin Gly Phe Ala Val Ser Lys Thr Ala 
370 375 380 

ggt gaa acg ggt ttc gag tgg ata tea ttc aag aca aac gat aac get 1200 

Gly Glu Thr Gly Phe Glu Trp He Ser Phe Lys Thr Asn Asp Asn Ala 

385 390 395 400 

tac att aac aca ctg age ggc caa aca teg tac ttg aga gca gtt cca 1248 

Tyr He Asn Thr Leu Ser Gly Gin Thr Ser Tyr Leu Arg Ala Val Pro 
405 410 415 

gtg gat gtg ate aaa gcg tea tat gga gtg aac gag gaa gaa gec aag 1296 

Val Asp Val He Lys Ala Ser Tyr Gly Val Asn Glu Glu Glu Ala Lys 
420 425 430 

agg ate aag ttt agt cag caa gag ace atg ttg tct atg aca cca age 1344 

Arg He Lys Phe Ser Gin Gin Glu Thr Met Leu Ser Met Thr Pro Ser 
435 440 445 

tct tct tct taa 1356 
Ser Ser Ser 
450 
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<210> 70 
<211> 451 
<212> PRT 

<213> Arabidopsis thaliana 
<400> 70 

Met His Lys Leu Leu Phe Ser Leu Leu Ser Val Val Ser Leu Ser Phe 
15 10 15 

Leu Leu Phe Phe His Gly Ala Glu Ala Arg Gin Arg Glu Ala Pro Phe 
20 25 30 . 

Pro Asn Ala Cys His Phe Ser Gin He Asn Ser Leu Ala Pro Ala Gin 
35 40 45 

Ala Thr Lys Phe Glu Ala Gly Gin Met Glu Val Trp Asp His Met Ser 
50 55 60 

Pro Glu Leu Arg Cys Ala Gly Val Thr Val Ala Arg He Thr Leu Gin 
65 70 75 80 

Pro Asn Ser He Phe Leu Pro Ala Phe Phe Ser Pro Pro Ala Leu Ala 
85 90 95 

Tyr Val Val Gin Gly Glu Gly Val Met Gly Thr He Ala Ser Gly Cys 
100 105 110 

Pro Glu Thr Phe Ala Glu Val Glu Gly Ser Ser Gly Arg Gly Gly Gly 
115 120 125 

Gly Asp Pro Gly Arg Arg Phe Glu Asp Met His Gin Lys Leu Glu Asn 
130 135 140 

Phe Arg Arg Gly Asp Val Phe Ala Ser Leu Ala Gly Val Ser Gin Trp 
145 150 155 160 

Trp Tyr Asn Arg Gly Asp Ser Asp Al$. Val He Val He Val Leu Asp 
165 ~ 170 175 

Val Thr Asn Arg Glu Asn Gin Leu Asp Gin Val Pro Arg Met Phe Gin 
180 185 190 

Leu Ala Gly Ser Arg Thr Gin Glu Glu Glu Gin Pro Leu Thr Trp Pro 
195 200 205 

Ser Gly Asn Asn Ala Phe Ser Gly Phe Asp Pro Asn He He Ala Glu 
210 215 220 

Ala Phe Lys He Asn He Glu Thr Ala Lys Gin Leu Gin Asn Gin Lys 
225 230 235 240 

Asp Asn Arg Gly Asn He He Arg Ala Asn Gly Pro Leu His Phe Val 
• 245 250 255 

He Pro Pro Pro Arg Glu Trp Gin Gin Asp Gly He Ala Asn Gly He 
260 265 270 " 

Glu Glu Thr Tyr Cys Thr Ala Lys He His Glu' Asn He Asp Asp Pro 
275 280 285 

Glu Arg Ser Asp His Phe Ser Thr Arg Ala Gly Arg He Ser Thr Leu 
290 295 300 

Asn Ser Leu Asn Leu Pro Val Leu Arg Leu Val Arg Leu Asn Ala Leu 
305 310 315 * 320 

Arg Gly Tyr Leu Tyr Ser Gly Gly Met Val Leu Pro Gin Trp Thr Ala 
325 330 335 

Asn Ala His Thr Val Leu Tyr Val Thr Gly Gly Gin Ala Lys He Gin 
340 345 350 
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Val Val Asp Asp Asn Gly Gin Ser Val Phe Asn Glu Gin Val Gly Gin 
355 360 365 

Gly Gin He He Val He Pro Gin Gly Phe Ala Val Ser Lys Thr Ala 
370 375 380 

Gly Glu Thr Gly Phe Glu Trp He Ser Phe Lys Thr Asn Asp Asn Ala 
385 390 395 . 400 

Tyr He Asn Thr Leu Ser Gly Gin Thr Ser Tyr Leu Arg Ala Val Pro 
405 410 415 

Val Asp Val He Lys Ala Ser Tyr Gly Val Asn Glu Glu Glu Ala Lys 
420 425 430 

Arg He Lys Phe Ser Gin Gin Glu Thr Met Leu Ser Met Thr Pro Ser 
435 440 445 

Ser Ser Ser 
450 



<210> 71 
<211> 867 
<212> DNA 

<213> Arabidopsis thaliana 

<220> 

<221> CDS 

<222> (1) . . (864) 

<223> prohibitin 1 

<400> 71 

atg aac aac gtc aaa gtt cca aag ata cca ggt ggt ggt gcc att teg 48 
Met Asn Asn Val Lys Val Pro Lys He Pro Gly Gly Gly Ala He Ser 
15 10 15 

acg ttg ctt aag gtt ggg att att ggt ggg ctt ggc etc tat ggt get 96 
Thr Leu Leu Lys Val Gly He He Gly Gly Leu Gly Leu Tyr Gly Ala 
20 25 30 

acg cac agt etc tac aat gtt gaa gga gga cat cga gcc ate atg ttc _ 144 
Thr His Ser Leu Tyr Asn Val Glu Gly Gly His Arg Ala He Met Phe 
35 40 45 

aat cgt tta gtc ggt att aaa gat aag gtt tac cct gag ggt aca cac 192 
Asn Arg Leu Val Gly He Lys Asp Lys Val Tyr Pro Glu Gly Thr His 
50 55 60 

ctt atg att cct tgg ttt gaa agg ccg gtc ate tat gac gtt cgt get 240 
Leu Met He Pro Trp Phe Glu Arg Pro Val He Tyr Asp Val Arg Ala 
65 70 75 80 

cga cct tac ctt gtt gag agt aca tec gga age cgt gat ctt cag atg 288 
Arg Pro Tyr Leu Val Glu Ser Thr Ser Gly Ser Arg Asp Leu Gin Met 
85 90 95 

gtg aaa att ggg ctt agg gtt etc aca cgt ccc atg gca gac cag tta 336 
Val Lys He Gly Leu Arg Val Leu Thr Arg Pro Met Ala Asp Gin Leu 
100 105 110 

cct gaa ate tac aga age ctt ggt gag aac tac age gag aga gtt eta 384 
Pro Glu He Tyr Arg Ser Leu Gly Glu Asn Tyr Ser Glu Arg Val Leu 
115 120 125 

cct tct ata ate aac gag act ttg aaa get gtg gtt get cag tac aat 432 
Pro Ser He He Asn Glu Thr Leu Lys Ala Val Val Ala Gin Tyr Asn 
130 135 140 
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gca age cag ctt att act cag aga gag gcg gtc agt agg gag ate agg 480 

Ala Ser Gin Leu He Thr Gin Arg Glu Ala Val Ser Arg Glu He Arg 
145 150 155 160 

aag att ctg act gaa cga gca gca aac ttc aat gtt gcg ctt gac gat 528 
Lys He Leu Thr Glu Arg Ala Ala Asn Phe Asn Val Ala Leu Asp Asp 
165 170 175 

gtg- tec ate aca aac ctg aca ttc ggg aag gag ttc aca get gec att 576 
Val Ser He Thr Asn Leu Thr Phe Gly Lys Glu Phe Thr Ala Ala He 
180 185 190 

gaa gca aag cag gtg gcg get caa gag get gag egg get aag ttc att 624 
Glu Ala Lys Gin Val Ala Ala Gin Glu Ala Glu Arg Ala Lys Phe He. 
195 * 200 205 

gtt gag aag gec gaa caa gac aag aga agt get gtt ate cgc gee cag 672 
Val Glu Lys Ala Glu Gin Asp Lys Arg Ser Ala Val He Arg Ala Gin 
210 ' 215 220 

gga gaa gee aag agt get cag etc att ggt caa gca att gca aac aac 720 
Gly Glu Ala Lys Ser Ala Gin Leu He Gly Gin Ala He Ala Asn. Asn 
225 230 235 240 

caa gcg ttt ate acg etc agg aag ate gag get gca aga gag att gca 768 
Gin Ala Phe He Thr Leu Arg Lys lie Glu Ala Ala Arg Glu He Ala 
245 250 255 

cag ace ata gca aac teg gcg aac aag gtt tac ttg age tea gac gat 816 
Gin Thr He Ala Asn Ser Ala Asn Lys Val Tyr Leu Ser Ser Asp Asp 
260 265 270 

ctt ttg ctt aac eta caa ggg atg aat ttg gat gtt gat gca aag aac 864 
Leu Leu Leu Asn Leu Gin Gly Met Asn Leu Asp Val Asp Ala Lys Asn 
275 280 285 

tag . 867 

<210> 72 
<211> 288 
<212> PRT 

<213> Arabidopsis thaliana 
<400> 72 

Met Asn Asn Val Lys Val Pro Lys He Pro Gly Gly* Gly Ala He Ser 
15 10 15 

Thr Leu Leu Lys Val Gly He He Gly Gly Leu Gly Leu Tyr Gly Ala 
20 25 30 

Thr His Ser Leu Tyr Asn Val Glu Gly Gly His Arg Ala He Met Phe 
35 40 45 

Asn Arg Leu Val Gly He Lys Asp Lys Val Tyr Pro Glu Gly Thr His 
50 55 60 

Leu Met He Pro Trp Phe Glu Arg Pro Val He Tyr Asp Val Arg Ala 
'65 70 75 80 

Arg Pro Tyr Leu Val Glu Ser Thr Ser Gly Ser Arg Asp Leu Gin Met 
85 90 95 

Val Lys He Gly Leu Arg Val Leu Thr Arg Pro Met Ala Asp Gin Leu 
.100 105 110 

Pro Glu He Tyr Arg Ser Leu Gly Glu Asn Tyr Ser Glu Arg Val Leu 
115 120 125 



WO 03/078629 




PCT/EP03/02735 



85 



Pro Ser lie lie Asn Glu Thr Leu Lys Ala Val Val Ala Gin Tyr Asn 
130 135 140 

Ala Ser Gin Leu He Thr Gin Arg Glu Ala Val Ser Arg Glu He Arg 
145 150 155 . 160 

Lys He Leu Thr Glu Arg Ala Ala Asn Phe Asn Val Ala Leu Asp Asp 
165 • 170 175 

Val Ser He Thr Asn Leu Thr Phe Gly Lys Glu Phe Thr Ala Ala He 
180 185 190 

Glu Ala Lys Gin Val Ala Ala Qln Glu Ala Glu Arg Ala Lys Phe He 
195 200 205 

Val Glu Lys Ala Glu Gin Asp Lys .Arg Ser Ala Val He Arg Ala Gin 
210 215 2-20 

Gly Glu Ala Lys Ser Ala Gin Leu lie Gly Gin Ala He Ala Asn Asn 
225 230 235 240 

Gin Ala Phe He Thr Leu Arg Lys He Glu Ala Ala Arg Glu He Ala 
245 250 255 

Gin Thr He Ala Asn Ser Ala Asn Lys Val Tyr Leu Ser Ser Asp Asp 
260 265 270 

Leu Leu Leu Asn Leu Gin Gly Met Asn Leu Asp Val Asp Ala Lys Asn 
275 280 285 



<210> 73 
<211> 40 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotid primer 

<400> 73 

ataagaatgc ggccgcgtgt tccatttggc cggaaacaac 40 

<210> 74 
<211> 33 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotid primer 

<400> 74 

cccggatcct tctgtaacat ttgacaaaac atg 33 

<210> 75 
<211> 40 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotid primer 

<400> 75 

ataagaatgc ggccgcgtgt tccatttggc cggaaacaac 40 

<210> 76 
<211> 44 
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<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: 
oligonucleotid primer 

<400> 76 

ataagaatgc ggccgcggat ccaccctgga gaacgccacg agtg 44 

<210> 77 
<211> 45 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223:> Beschreibung der kunstlichen Sequenz: 
oligonucleotid primer 

<400> 77 

ataagaatgc ggccgcggat ccctcagggt cttttcttgc ccact 45 

<210> 78 
<211> 30 
<212> DNA " 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: 
oligonucleotid primer 

<400> 78 

ccgctcgagt ttacggatgg agccacgaag 30 

<210> 79 
<211> 30 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: 
oligonucleotid primer 

<400> 79 

ccgctcgagg taagctcaac aaatctttag 30 

<210> 80 
<211> 31 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: 
oligonucleotid primer 

<400> 80 

acgcgtcgac gcgttctgcg tgcaagatat t 31 

<210> 81 
<211> 46 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: 
oligonucleotid primer 
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<400> 81 

ataagaatgc ggccgcggat ccatggctaa caagctcttc ctcgtc 46 

<210> 82 
<211> 45 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotid primer 

<400> 82 

ataagaatgc ggccgcggat ccctagtagt aaggagggaa- gaaag 45 

<210> 83 
<211> 4954 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen .Sequenz : DNA 

construct coding for dsRNA for suppression of 
multiple storage- proteins 

<400> 83 

agcttggtac cgagctcgga tccactagta acggccgcca gtgtgctgga attcgccctt 60 
gcggccgcgt gttccatttg gccggaaaca accagcaggg aggctttggc ggttcacagc 120 
aacaacaaga acagaaaaac ttgtggagcg ggttcgacgc acaggtcata gctcaagcat 180 
tgaaaattga cgttcagttg gctcagcagc ttcagaacca acaagacagc agaggaaaca 240 
tcgttcgtgt taagggacct ttccaggtcg tgaggccacc tctaagacag ccctacgaga 300 
gcgaggagtg gagacaccca cgtagcccac agggcaacgg ccttgaggag actatctgca 360 
gcatgaggtc ccacgagaac attgacgacc ctgctcgtgc tgacgtgtac aagcccagcc 420 
taggtcgcgt gaccagcgtc aacagctata ccttgcccat cttggagtat gtcaggctca 480 
gtgccactcg tggcgttctc cagggtggat ccttctgtaa catttgacaa aacatgtgaa 540 
cacgtcatcc gtcatataga acttccaatt ttaatatgtt ttgctaaaga aaaaaaaaag 600 
gaataaatat ctatcaaatt catttttaaa acatttgtat acgttcttaa ataatttagg 660 
atatgactaa tttt'tctttt tggtaaaaat gttaatatct atatttaatt tattaagaaa 720 
aatgtactta caccctggag aacgccacga gtggcactga gcctgacata ctccaagatg 780 
ggcaaggtat agctgttgac gctggtcacg cgacctaggc tgggcttgta cacgtcagca 840 
cgagcagggt cgtcaatgtt ctcgtgggac ctcatgctgc agatagtctc ctcaaggccg 900 
ttgccctgtg ggctacgtgg gtgtctccac tcctcgctct cgtagggctg tcttagaggt 960 
ggcctcacga cct'ggaaagg tcccttaaca cgaacgatgt ttcctctgct gtcttgttgg 1020 
ttctgaagct gctgagccaa ctgaacgtca attttcaatg cttgagctat gacctgtgcg 1080 
tcgaacccgc tccacaagtt tttctgttct tgttgttgct gtgaaccgcc aaagcctccc 1140 
tgctggttgt ttccggccaa atggaacacg cggccgcaag ggcgaattct gcagatatcc 1200 
atcacactgg cggccgctcg acgtaagctc aacaaatctt tagaaaatta attttatgtg 1260 
acatatgcaa taatttgatt tggcaagata aactaataga ttttgcgatt tggagtttta 1320 
aactctaaat aatctaaatc gttttcaatt ggtttaaata tatatcttgc atttttaatc 1380 
gtttttaatt aaaaaatata tatatatata tatatcttgc atttttaatc gttttcaatt 1440 
taaaaaatat cttgcacgca gaacgctctc gagcggccgc ggatcctcag ggtcttttct 1500 
tgcccacttt cttgaacgcc ggcaaactca cgtttgttgt tcacggaagg ggtctaatgg 1560 
gaagagttat tccgggatgc gccgagacgt tcatggagtc accggtattt ggagaaggtc 1620 
aaggtcaggg tcagagtcaa gggttccgtg acatgcacca gaaagtagag cacctacggt 1680 
gcggtgacac cattgcaaca ccatctggtg tagctcaatg gttctacaac aatggaaatg 1740 
agcctctcat tcttgttgca gccgcggatc tcgccagcaa ccagaaccag cttgaccgca 1800 
accttagac.c atttttgata gccggaaaca acccacaagg gcaggaatgg ctacaaggcc 1860 
gaaagcaaca gaagcaaaac aacatcttca atggcttcgc acctgagatc ttggctcaag 1920 
ccttcaagat caatgtcgag acggctcagc agctccagaa ccagcaagat aaccgtggca 1980 
acatcgtcaa ggtcaacgga cctttcggcg tcattaggcc acccttgaga cgcggcgaag 2040 
gcggccaaca accacatgaa atagctaatg gtttagagga gactttgtgc accatgcgat 2100 
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gcactgaaaa cctcgatgac ccgtcggatg ctgacgtgta caagccatca ctcggataca 2160 
ttagcacact taacagctac aatcttccta tcctcagact tctccgcctt agcgctcttc 2220 
gtggctccat ccgtaaaact cgaggtaagc tcaacaaatc tttagaaaat taattttatg 2280 
tgacatatgc aataatttga tttggcaaga taaactaata gattttgcga tttggagttt 2340 
taaactctaa ataatctaaa tcgttttcaa ttggtttaaa tatatatctt gcatttttaa 2400 
tcgtttttaa ttaaaaaata tatatatata tatatatctt gcatttttaa tcgttttcaa 2460 
tttaaaaaat atcttgcacg cagaacgctg tcgagtttta cggatggagc cacgaagagc 2520 
gctaaggcgg agaagtctga ggataggaag attgtagctg ttaagtgtgc taatgtatcc 2580 
gagtgatggc ttgtacacgt cagcatccga cgggtcatcg aggttttcag tgcatcgcat 2640 
ggtgcacaaa gtctcctcta aaccattagc tatttcatgt ggttgttggc cgccttcgcc 2700 
gcgtctcaag ggtggcctaa tgacgccgaa aggtccgttg accttgacga tgttgccacg 2760 
gttatcttgc tggttctgga gctgctgagc cgtctcgaca ttgatcttga aggcttgagc 2820 
caagatctca ggtgcgaagc cattgaagat gttgttttgc ttctgttgct ttcggccttg 2880 
tagccattcc tgcccttgtg ggttgtttcc ggctatcaaa aatggtctaa ggttgcggtc 2940 
aagctggttc tggttgctgg cgagatccgc ggctgcaaca agaatgagag gctcatttcc 3000 
attgttgtag aaccattgag ctacaccaga tggtgttgca atggtgtcac cgcaccgtag 3060 
gtgctctact ttctggtgca tgtcacggaa cccttgactc tgaccctgac cttgaccttc 3120 
tccaaatacc ggtgactcca tgaacgtctc ggcgcatccc ggaataactc ttcccattag 3180 
accccttccg tgaacaacaa acgtgagttt gccggcgttc aagaaagtgg gcaagaaaag 3240 
accctgagga tccgcggccg cgcatgcatc tagctcgagg taagctcaac aaatctttag 3300 
aaaattaatt ttatgtgaca' tatgcaataa tttgatttgg caagataaac taatagattt 3360 
tgcgatttgg agttttaaac tctaaataat ctaaatcgtt ttcaattggt ttaaatatat 3420 
atcttgcatt tttaatcgtt tttaattaaa aaatatatat atatatatat atcttgcatt 3480 
tttaatcgtt ttcaatttaa aaaatatctt gcacgcagaa cgctagggcc gcggccgcgg 3540 
atccatggct aacaagctct tcctcgtctg cgcaactctc gccctctgct tcctcctcac 3600 
caacgcttcc atctaccgca ccgttgtcga attcgaagaa gatgacgcca gcaaccccgt 3660' 
aggtccaaga cagagatgcc agaaggagtt tcagcaatca caacacctaa gagcttgcca 3720 
gagatggatg agcaagcaaa tgaggcaagg acgtggtggt ggtccttccc tcgacgatga 3780 
gttcgatttc gagggccccc agcagggata ccagctactc cagcagtgct gcaacgagct 3840 
tcgccaggaa gagccagttt gcgtttgccc caccttgaaa caagctgcca gggcagttag 3900 
cctccaggga cagcacggac cattccaatc caggaaaatt taccagtcag ctaagtactt 3960 
gcctaacatt tgcaagatcc agcaagttgg tgaatgtccc ttccagacca ccatcccttt 4020 
cttccctcct tactactagg gtactcgagg taagctcaac aaatctttag aaaattaatt 4080 
ttatgtgaca tatgcaataa tttgatttgg caagataaac taatagattt tgcgatttgg 4140 
agttttaaac tctaaataat ctaaatcgtt ttcaattggt ttaaatatat atcttgcatt 4200 
tttaatcgtt tttaattaaa aaatatatat atatatatat atcttgcatt tttaatcgtt 4260 
ttcaatttaa aaaatatctt gcacgcagaa cgctgtcgac taccctagta gtaaggaggg 432 0 
aagaaaggga tggtggtctg gaagggacat tcaccaactt gctggatctt gcaaatgtta 4380 
ggcaagtact tag.ctgactg gtaaattttc ctggattgga atggtccgtg ctgtccctgg 4440 
aggctaactg ccctggcagc ttgtttcaag gtggggcaaa cgcaaactgg ctcttcctgg 4500 
cgaagctcgt tgcagcactg ctggagtagc tggtatccct gctgggggcc ctcgaaatcg 4560 
aactcatcgt cgagggaagg accaccacca cgtccttgcc tcatttgctt gctcatccat 4620 
ctctggcaag ctcttaggtg ttgtgattgc tgaaactcct tctggcatct ctgtcttgga 4680 
cctacggggt tgctggcgtc atcttcttcg aattcgacaa cggtgcggta gatggaagcg 4740 
ttggtgagga ggaagcagag ggcgagagtt gcgcagacga ggaagagctt gttagccatg 4800 
gatcaattcg ccctatagtg agtcgtatta caattcactg gccgtcgttt tacaacgtcg 4860 
tgactgggaa aaccctggcg ttacccaact taatcgcctt gcagcacatc cccctttcgc 4920 
cagctggcgt aatagcgaag aggcccgcac cgat 4954 

<210> 84 
<211> 4954 
<212> RNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: RNA coding 
for dsRNA for suppression of multiple storage 
proteins 
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<400> 84 

agcuugguac cgagcucgga uccacuagua 
gcggccgcgu guuccauuug gccggaaaca 
aacaacaaga acagaaaaac uuguggagcg 
ugaaaauuga cguucaguug gcucagcagc 
ucguucgugu uaagggaccu uuccaggucg 
gcgaggagug gagacaccca cguagcccac 
gcaugagguc ccacgagaac auugacgacc 
uaggucgcgu gaccagcguc aacagcuaua 
gugccacucg uggcguucuc caggguggau 
cacgucaucc gucauauaga acuuccaauu 
gaauaaauau cuaucaaauu cauuuuuaaa 
auaugacuaa uuuuucuuuu ugguaaaaau 
aauguacuua cacccuggag aacgccacga 
ggcaagguau agcuguugac gcuggucacg 
cgagcagggu cgucaauguu cucgugggac 
uugcccugug ggcuacgugg gugucuccac 
ggccucacga ccuggaaagg ucccuuaaca 
uucugaagcu gcugagccaa cugaacguca 
ucgaacccgc uccacaaguu uuucuguucu 
ugcugguugu uuccggccaa auggaacacg 
aucacacugg cggccgcucg acguaagcuc 
acauaugcaa uaauuugauu uggcaagaua 
aacucuaaau aaucuaaauc guuuucaauu 
guuuuuaauu aaaaaauaua uauauauaua 
uaaaaaauau cuugcacgca gaacgcucuc 
ugcccacuuu cuugaacgcc ggcaaacuca 
gaagaguuau uccgggaugc gccgagacgu 
aaggucaggg ucagagucaa ggguuccgug 
gcggugacac cauugcaaca ccaucuggug 
agccucucau ucuuguugca gccgcggauc 
accuuagacc auuuuugaua gccggaaaca 
gaaagcaaca gaagcaaaac aacaucuuca 
ccuucaagau caaugucgag acggcucagc 
acaucgucaa ggucaacgga ccuuucggcg 
gcggccaaca accacaugaa auagcuaaug 
gcacugaaaa ccucgaugac ccgucggaug 
uuagcacacu uaacagcuac aaucuuccua 
guggcuccau ccguaaaacu cgagguaagc 
ugacauaugc aauaauuuga uuuggcaaga 
uaaacucuaa auaaucuaaa ucguuuucaa 
ucguuuuuaa uuaaaaaaua uauauauaua 
uuuaaaaaau aucuugcacg cagaacgcug 
gcuaaggcgg agaagucuga ggauaggaag 
gagugauggc uuguacacgu cagcauccga 
ggugcacaaa gucuccucua aaccauuagc 
gcgucucaag gguggccuaa ugacgccgaa 
guuaucuugc ugguucugga gcugcugagc 
caagaucuca ggugcgaagc cauugaagau 
uagccauucc ugcccuugug gguuguuucc 
aagcugguuc ugguugcugg cgagauccgc 
auuguuguag aaccauugag cuacaccaga 
gugcucuacu uucuggugca ugucacggaa 
uccaaauacc ggugacucca ugaacgucuc 
accccuuccg ugaacaacaa acgugaguuu 
acccugagga uccgcggccg cgcaugcauc 
aaaauuaauu uuaugugaca uaugcaauaa 
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acggccgcca gugugcugga auucgcccuu 60 
accagcaggg aggcuuuggc gguucacagc 120 
gguucgacgc acaggucaua gcucaagcau 180 
uucagaacca acaagacagc agaggaaaca 240 
ugaggccacc ucuaagacag cccuacgaga 300 
agggcaacgg ccuugaggag acuaucugca 360 
cugcucgugc ugacguguac aagcccagcc 420 
ccuugcccau cuuggaguau gucaggcuca 480 
ccuucuguaa cauuugacaa aacaugugaa 540 
uuaauauguu uugcuaaaga aaaaaaaaag 600 
acauuuguau acguucuuaa auaauuuagg 660 
guuaauaucu auauuuaauu uauuaagaaa 720 
guggcacuga gccugacaua cuccaagaug 780 
cgaccuaggc ugggcuugua cacgucagca 840 
cucaugcugc agauagucuc cucaaggccg 900 
uccucgcucu cguagggcug ucuuagaggu 960 
cgaacgaugu uuccucugcu gucuuguugg 1020 
auuuucaaug .cuugagcuau gaccugugcg 1080 
uguuguugcu gugaaccgcc aaagccuccc 1140 
cggccgcaag ggcgaauucu gcagauaucc 1200 
aacaaaucuu uagaaaauua auuuuaugug 1260 
aacuaauaga uuuugcgauu uggaguuuua 1320 
gguuuaaaua uauaucuugc auuuuuaauc 13 80 
uauaucuugc auuuuuaauc guuuucaauu 1440 
gagcggccgc ggauccucag ggucuuuucu 1500 
cguuuguugu ucacggaagg ggucuaaugg 1560 
ucauggaguc accgguauuu ggagaagguc 1620 
acaugcacca gaaaguagag caccuacggu 1680 
uagcucaaug guucuacaac aauggaaaug 1740 
ucgccagcaa ccagaaccag cuugaccgca 1800 
acccacaagg gcaggaaugg cuacaaggcc 1860 
auggcuucgc accugagauc uuggcucaag 1920 
agcuccagaa ccagcaagau aaccguggca 1980 
ucauuaggcc acccuugaga cgcggcgaag 2040 
guuuagagga gacuuugugc accaugcgau 2100 
cugacgugua caagccauca cucggauaca 2160 
uccucagacu ucuccgccuu agcgcucuuc 2220 
ucaacaaauc uuuagaaaau uaauuuuaug 2280 
uaaacuaaua gauuuugcga uuuggaguuu 2340 
uugguuuaaa uauauaucuu gcauuuuuaa 2400 
uauauaucuu gcauuuuuaa ucguuuucaa 2460 
ucgaguuuua cggauggagc cacgaagagc 2520 
auuguagcug uuaagugugc uaauguaucc 2580 
cgggucaucg agguuuucag ugcaucgcau 2 640 
uauuucaugu gguuguuggc cgccuucgcc 2700 
agguccguug accuugacga uguugccacg 2760 
cgucucgaca uugaucuuga aggcuugagc 2820 
guuguuuugc uucuguugcu uucggccuug 2880 
ggcuaucaaa aauggucuaa gguugcgguc 2940 
ggcugcaaca agaaugagag gcucauuucc 3000 
ugguguugca auggugucac cgcaccguag 3060 
cccuugacuc ugacccugac cuugaccuuc 3120 
ggcgcauccc ggaauaacuc uucccauuag 3180 
gccggcguuc aagaaagugg gcaagaaaag 3240 
uagcucgagg uaagcucaac aaaucuuuag 3300 
uuugauuugg caagauaaac uaauagauuu 3360 
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ugcgauuugg aguuuuaaac ucuaaauaau cuaaaucguu uucaauuggu uuaaauauau 3420 
aucuugcauu uuuaaucguu uuuaauuaaa aaauauauau auauauauau aucuugcauu 3480 
uuuaaucguu uucaauuuaa. aaaauaucuu gcacgcagaa cgcuagggcc gcggccgcgg 3540 
auccauggcu aacaagcucu uccucgucug cgcaacucuc gcccucugcu uccuccucac 3600 
caacgcuucc aucuaccgca ccguugucga auucgaagaa gaugacgcca gcaaccccgu 3660 
agguccaaga cagagaugcc agaaggaguu ucagcaauca caacaccuaa gagcuugcca 3720 
gagauggaug agcaagcaaa ugaggcaagg acgugguggu gguccuuccc ucgacgauga 3780 
guucgauuuc gagggccccc agcagggaua ccagcuacuc cagcagugcu gcaacgagcu 3840 
ucgccaggaa gagccaguuu gcguuugccc caccuugaaa caagcugcca gggcaguuag 3900 
ccuccaggga cagcacggac cauuccaauc caggaaaauu uaccagucag cuaaguacuu 3960 
gccuaacauu ugcaagaucc agcaaguugg ugaauguccc uuccagacca ccaucccuuu 4020 
cuucccuccu uacuacuagg guacucgagg uaagcucaac aaaucuuuag aaaauuaauu 4080 
uuaugugaca uaugcaauaa uuugauuugg caagauaaac uaauagauuu- ugcgauuugg 4140 
aguuuuaaac ucuaaauaau cuaaaucguu uucaauuggu uuaaauauau aucuugcauu 4200 
uuuaaucguu uuuaauuaaa aaauauauau auauauauau aucuugcauu uuuaaucguu 4260 
uucaauuuaa aaaauaucuu gcacgcagaa cgcugucgac uacccuagua guaaggaggg 4320 
aagaaaggga ugguggucug gaagggacau ucaccaacuu gcuggaucuu gcaaauguua 4380 
ggcaaguacu uagcugacug .guaaauuuuc cuggauugga augguccgug cugucccugg 4440 
aggcuaacug cccuggcagc uuguuucaag guggggcaaa cgcaaacugg cucuuccugg 4500 
cgaagcucgu ugcagcacug cuggaguagc ugguaucccu gcugggggcc cucgaaaucg 4560 
aacucaucgu cgagggaagg accaccacca cguccuugcc ucauuugcuu gcucauccau 4620 
cucuggcaag cucuuaggug uugugauugc ugaaacuccu ucuggcaucu cugucuugga 4680 
ccuacggggu ugcuggcguc aucuucuucg aauucgacaa cggugcggua gauggaagcg 4740 
uuggugagga ggaagcagag ggcgagaguu gcgcagacga ggaagagcuu guuagccaug 4800 
gaucaauucg cccuauagug agucguauua caauucacug gccgucguuu uacaacgucg 4860 
ugacugggaa aacccuggcg uuacccaacu uaaucgccuu gcagcacauc ccccuuucgc 4920 
cagcuggcgu aauagcgaag aggcccgcac cgau • 4954 

<210> 85 
<211> 4456 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: DNA 

construct coding for dsRNA for suppression of 
multiple storage proteins 

<400> 85 

agcttggtac cgagctcgga tccactagta acggccgcca gtgtgctgga attcgccctt 60 
gcggccgcgg atcctcaggg tcttttcttg cccactttct tgaacgccgg caaactcacg 120 
tttgttgttc acggaagggg tctaatggga agagttattc cgggatgcgc cgagacgttc 180 
atggagtcac cggtatttgg agaaggtcaa ggtcagggtc agagtcaagg gttccgtgac 240 
atgcaccaga aagtagagca cctacggtgc ggtgacacca ttgcaacacc atctggtgta 300 
gctcaatggt tctacaacaa tggaaatgag cctctcattc ttgttgcagc cgcggatctc 360 
gccagcaacc agaaccagct tgaccgcaac cttagaccat ttttgatagc cggaaacaac 420 
ccacaagggc aggaatggct acaaggccga aagcaacaga agcaaaacaa catcttcaat 480 
ggcttcgcac ctgagatctt ggctcaagcc ttcaagatca atgtcgagac ggctcagcag 540 
ctccagaacc agcaagataa ccgtggcaac atcgtcaagg tcaacggacc tttcggcgtc 600 
attaggccac ccttgagacg cggcgaaggc ggccaacaac cacatgaaat agctaatggt 660 
ttagaggaga ctttgtgcac catgcgatgc actgaaaacc tcgatgaccc gtcggatgct 720 
gacgtgtaca agccatcact cggatacatt agcacactta acagctacaa tcttcctatc 780 
ctcagacttc tccgccttag cgctcttcgt ggctccatcc gtaaaaggat ccgcggccgc 840 
aagggcgaat tctgcagatc cttcagggtc ttttcttgcc cactttcttg aacgccggca 900 
aactcacgtt tgttgttcac ggaaggggtc taatgggaag agttattccg ggatgcgccg 960 
agacgttcat ggagtcaccg gtatttggag aaggtcaagg tcagggtcag agtcaagggt 1020 
tccgtgacat gcaccagaaa gtagagcacc tacggtgcgg tgacaccatt gcaacaccat 1080 
ctggtgtagc tcaatggttc tacaacaatg gaaatgagcc tctcattctt gttgcagccg 1140 
cggatctcgc cagcaaccag aaccagcttg accgcaacct tagaccattt ttgatagccg 1200 
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gaaacaaccc acaagggcag gaatggctac 
tcttcaatgg cttcgcacct gagatcttgg 
ctcagcagct ccagaaccag caagataacc 
tcggcgtcat taggccaccc ttgagacgcg 
ctaatggttt agaggagact .ttgtgcacca 
cggatgctga cgtgtacaag ccatcactcg 
ttcctatcct cagacttctc cgccttagcg 
atggctaaca agctcttcct cgtctgcgca 
gcttccatct accgcaccgt tgtcgaattc 
ccaagacaga gatgccagaa ggagtttcag 
tggatgagca agcaaatgag gcaaggacgt 
gatttcgagg gcccccagca gggataccag 
caggaagagc cagtttgcgt ttgccccacc 
cagggacagc acggaccatt ccaatccagg 
aacatttgca agatccagca agttggtgaa 
cctccttact actagggtag atatccatca 
aatctttaga aaattaattt tatgtgacat 
aatagatttt gcgatttgga gttttaaact 
taaatatata tcttgcattt ttaatcgttt 
tcttgcattt ttaatcgttt tcaatttaaa 
ccctagtagt aaggagggaa gaaagggatg 
tggatcttgc aaatgttagg caagtactta 
ggtccgtgct gtccctggag gctaactgcc 
caaactggct cttcctggcg aagctcgttg 
tgggggccct cgaaatcgaa ctcatcgtcg 
atttgcttgc tcatccatct ctggcaagct 
tggcatctct gtcttggacc tacggggttg 
gtgcggtaga tggaagcgtt ggtgaggagg 
aagagcttgt tagccatagg atcttttacg 
aagtctgagg ataggaagat tgtagctgtt 
gtacacgtca gcatccgacg ggtcatcgag 
ctcctctaaa ccattagcta tttcatgtgg 
tggcctaatg acgccgaaag gtccgttgac 
gttctggagc tgctgagccg tctcgacatt 
tgcgaagcca ttgaagatgt tgttttgctt 
cccttgtggg ttgtttccgg ctatcaaaaa 
gttgctggcg agatccgcgg ctgcaacaag 
ccattgagct acaccagatg gtgttgcaat 
ctggtgcatg tcacggaa'cc cttgactctg 
tgactccatg aacgtctcgg cgcatcccgg 
aacaacaaac gtgagtttgc cggcgttcaa 
ctgcagaatt cgcccttgcg gccgcggatc 
aggcggagaa gtctgaggat aggaagattg 
gatggcttgt acacgtcagc atccgacggg 
cacaaagtct cctctaaacc attagctatt 
ctcaagggtg gcctaatgac gccgaaaggt 
tcttgctggt tctggagctg ctgagccgtc 
atctcaggtg cgaagccatt gaagatgttg 
cattcctgcc cttgtgggtt gtttccggct 
tggttctggt tgctggcgag atccgcggct 
ttgtagaacc attgagctac accagatggt 
tctactttct ggtgcatgtc acggaaccct 
aataccggtg actccatgaa cgtctcggcg 
cttccgtgaa caacaaacgt gagtttgccg 
tgactcgagc atgcat 
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aaggccgaaa gcaacagaag caaaacaaca 1260 
ctcaagcctt caagatcaat gtcgagacgg 1320 
gtggcaacat cgtcaaggtc aacggacctt 1380 
gcgaaggcgg ccaacaacca catgaaatag . 1440 
tgcgatgcac tgaaaacctc gatgacccgt 1500 
gatacattag cacacttaac agctacaatc 1560 
ctcttcgtgg ctccatccgt aaaagatcct 1620 
actctcgccc tctgcttcct cctcaccaac 1680 
gaagaagatg acgccagcaa ccccgtaggt 1740 
caatcacaac acctaagagc ttgccagaga 1800 
gfftggtggtc cttccctcga cgatgagttc 1860 
ctactccagc agtgctgcaa cgagcttcgc 1920 
ttgaaacaag ctgccagggc agttagcctc 1980 
aaaatttacc agtcagctaa gtacttgcct 2040 
tgtcccttcc agaccaccat ccctttcttc 2100 
cactggcggc cgctcgacgt aagctcaaca 2160 
atgcaataat ttgatttggc aagataaact 2220 
ctaaataatc taaatcgttt tcaattggtt 2280 
ttaattaaaa aatatatata tatatatata 2340 
aaatatcttg cacgcagaac gcctcgacta 2400 
gtggtctgga agggacattc accaacttgc 2460 
gctgactggt aaattttcct ggattggaat 2520 
ctggcagctt gtttcaaggt ggggcaaacg 2580 
cagcactgct ggagtagctg gtatccctgc 2640 
agggaaggac caccaccacg tccttgcctc 2700 
cttaggtgtt gtgattgctg aaactccttc 2760 
ctggcgtcat cttcttcgaa ttcgacaacg 2820 
aagcagaggg cgagagttgc gcagacgagg 2880 
gatggagcca cgaagagcgc taaggcggag 2940 
aagtgtgcta atgtatccga gtgatggctt 3000 
gttttcagtg catcgcatgg tgcacaaagt 3060 
ttgttggccg ccttcgccgc gtctcaaggg 3120 
cttgacgatg ttgccacggt tatcttgctg 3180 
gatcttgaag gcttgagcca agatctcagg 3240 
ctgttgcttt cggccttgta gccattcctg 3300 
tggtctaagg ttgcggtcaa gctggttctg 3360 
aatgagaggc tcatttccat tgttgtagaa 3420 
ggtgtcaccg caccgtaggt gctctacttt 3480 
accctgacct tgaccttctc caaataccgg 3540 
aataactctt cccattagac cccttccgtg 3600 
gaaagtgggc aagaaaagac cctgaaggat 3 660 
cttttacgga tggagccacg aagagcgcta 3720 
tagctgttaa gtgtgctaat gtatccgagt 3780 
tcatcgaggt tttcagtgca tcgcatggtg 3840 
tcatgtggtt gttggccgcc ttcgccgcgt 3900 
ccgttgacct tgacgatgtt gccacggtta 3960 
tcgacattga tcttgaaggc ttgagccaag 4020 
ttttgcttct gttgctttcg gccttgtagc 4080 
atcaaaaatg gtctaaggtt gcggtcaagc 4140 
gcaacaagaa tgagaggctc atttccattg 4200 
gttgcaatgg tgtcaccgca ccgtaggtgc 42 60 
tgactctgac cctgaccttg accttctcca 4320 
catcccggaa taactcttcc cattagaccc 4380 
gcgttcaaga aagtgggcaa gaaaagaccc 4440 

4456 



<210> 86 
<211> 4456 
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<212> RNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: RNA coding 
for ds RNA for suppression of multiple storage 
proteins 

<400> 86 

agcuugguac cgagcucgga uccacuagua acggccgcca gugugcugga auucgcccuu 60 
gcggccgcgg auccucaggg ucuuuucuug cccacuuucu ugaacgccgg caaacucacg 120 
uuuguuguuc acggaagggg ucuaauggga agaguuauuc cgggaugcgc cgagacguuc 180 
auggagucac cgguauuugg agaaggucaa ggucaggguc agagucaagg guuccgugac 240 
augcaccaga aaguagagca ccuacggugc ggugacacca uugcaacacc aucuggugua 300 
gcucaauggu ucuacaacaa uggaaaugag ccucucauuc uuguugcagc cgcggaucuc 360 
gccagcaacc agaaccagcu ugaccgcaac cuuagaccau uuuugauagc cggaaacaac 420 
ccacaagggc aggaauggcu acaaggccga aagcaacaga agcaaaacaa caucuucaau 480 
ggcuucgcac cugagaucuu ggcucaagcc uucaagauca augucgagac ggcucagcag 540 
cuccagaacc agcaagauaa ccguggcaac aucgucaagg ucaacggacc uuucggcguc 600 
auuaggccac ccuugagacg cggcgaaggc ggccaacaac cacaugaaau agcuaauggu 660 
uuagaggaga cuuugugcac caugcgaugc acugaaaacc ucgaugaccc gucggaugcu 720 
gacguguaca agccaucacu cggauacauu .agcacacuua acagcuacaa ucuuccuauc 780 
cucagacuuc uccgccuuag cgcucuucgu ggcuccaucc guaaaaggau ccgcggccgc 840 
aagggcgaau ucugcagauc cuucaggguc uuuucuugcc cacuuucuug aacgccggca 900 
aacucacguu uguuguucac ggaagggguc uaaugggaag aguuauuccg ggaugcgccg 960 
agacguucau ggagucaccg guauuuggag aaggucaagg ucagggucag agucaagggu 1020 
uccgugacau gcaccagaaa guagagcacc uacggugcgg ugacaccauu gcaacaccau 1080 
cugguguagc ucaaugguuc uacaacaaug gaaaugagcc ucucauucuu guugcagccg 1140 
cggaucucgc cagcaaccag aaccagcuug accgcaaccu uagaccauuu uugauagccg 1200 
gaaacaaccc acaagggcag gaauggcuac aaggccgaaa gcaacagaag caaaacaaca 1260 
ucuucaaugg cuucgcaccu gagaucuugg cucaagccuu caagaucaau gucgagacgg 1320 
cucagcagcu ccagaaccag caagauaacc guggcaacau cgucaagguc aacggaccuu 1380 
ucggcgucau uaggccaccc uugagacgcg gcgaaggcgg ccaacaacca caugaaauag 1440 
cuaaugguuu agaggagacu uugugcacca ugcgaugcac ugaaaaccuc gaugacccgu 1500 
cggaugcuga cguguacaag ccaucacucg gauacauuag cacacuuaac agcuacaauc 1560 
uuccuauccu cagacuucuc cgccuuagcg cucuucgugg cuccauccgu aaaagauccu 1620 
auggcuaaca agcucuuccu cgucugcgca acucucgccc ucugcuuccu ccucaccaac 1680 
gcuuccaucu accgcaccgu ugucgaauuc gaagaagaug acgccagcaa ccccguaggu 1740 
ccaagacaga gaugccagaa ggaguuucag caaucacaac accuaagagc uugccagaga 1800 
uggaugagca agcaaaugag gcaaggacgu gguggugguc cuucccucga cgaugaguuc 1860 
gauuucgagg gcccccagca gggauaccag cuacuccagc agugcugcaa cgagcuucgc 1920 
caggaagagc caguuugcgu uugccccacc uugaaacaag cugccagggc aguuagccuc 1980 
cagggacagc acggaccauu ccaauccagg aaaauuuacc agucagcuaa guacuugccu 2040 
aacauuugca agauccagca aguuggugaa ugucccuucc agaccaccau cccuuucuuc 2100 
ccuccuuacu acuaggguag auauccauca cacuggcggc cgcucgacgu aagcucaaca 2160 
aaucuuuaga aaauuaauuu uaugugacau augcaauaau uugauuuggc aagauaaacu 2220 
aauagauuuu gcgauuugga guuuuaaacu cuaaauaauc uaaaucguuu ucaauugguu 2280 
uaaauauaua ucuugcauuu uuaaucguuu uuaauuaaaa aauauauaua uauauauaua 2340 
ucuugcauuu uuaaucguuu ucaauuuaaa aaauaucuug cacgcagaac gccucgacua 2400 
cccuaguagu aaggagggaa gaaagggaug guggucugga agggacauuc accaacuugc 2460 
uggaucuugc aaauguuagg caaguacuua gcugacuggu aaauuuuccu ggauuggaau 2520 
gguccgugcu gucccuggag gcuaacugcc -cuggcagcuu guuucaaggu ggggcaaacg 2580 
caaacuggcu cuuccuggcg aagcucguug cagcacugcu ggaguagcug guaucccugc 2640 
ugggggcccu cgaaaucgaa cucaucgucg agggaaggac caccaccacg uccuugccuc 2700 
auuugcuugc ucauccaucu cuggcaagcu cuuagguguu gugauugcug aaacuccuuc 2760 
uggcaucucu gucuuggacc uacgggguug cuggcgucau cuucuucgaa uucgacaacg 2820 
gugcgguaga uggaagcguu ggugaggagg aagcagaggg cgagaguugc gcagacgagg 2880 
aagagcuugu uagccauagg aucuuuuacg gauggagcca cgaagagcgc uaaggcggag 2940 
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aagucugagg auaggaagau uguagcuguu aagugugcua auguauccga gugauggcuu 3000 
guacacguca gcauccgacg ggucaucgag guuuucagug caucgcaugg ugcacaaagu 3060 
cuccucuaaa ccauuagcua uuucaugugg uuguuggccg ccuucgccgc gucucaaggg 3120 
uggccuaaug acgccgaaag guccguugac cuugacgaug uugccacggu uaucuugcug 3180 
guucuggagc ugcugagccg ucucgacauu gaucuugaag gcuugagcca agaucucagg 3240 
ugcgaagcca uugaagaugu uguuuugcuu cuguugcuuu cggccuugua gccauuccug 3300 
cccuuguggg uuguuuccgg cuaucaaaaa uggucuaagg uugcggucaa gcugguucug 3360 
guugcuggcg agauccgcgg cugcaacaag aaugagaggc ucauuuccau uguuguagaa 3420 
ccauugagcu acaccagaug guguugcaau ggugucaccg caccguaggu gcucuacuuu 3480 
cuggugcaug ucacggaacc cuugacucug acccugaccu ugaccuucuc caaauaccgg 3540 
ugacuccaug aacgucucgg cgcaucccgg aauaacucuu cccauuagac cccuuccgug 3600 
aacaacaaac gugaguuugc cggcguucaa gaaagugggc aagaaaagac ccugaaggau 3 660 
cugcagaauu cgcccuugcg gccgcggauc cuuuuacgga uggagccacg aagagcgcua. 3720 
aggcggagaa gucugaggau aggaagauug uagcuguuaa gugugcuaau guauccgagu 3780 
gauggcuugu acacgucagc auccgacggg ucaucgaggu uuucagugca ucgcauggug 3840 
cacaaagucu ccucuaaacc auuagcuauu ucaugugguu guuggccgcc uucgccgcgu 3900 
cucaagggug gccuaaugac gccgaaaggu ccguugaccu ugacgauguu gccacgguua- 3960 
ucuugcuggu ucuggagcug cugagccguc ucgacauuga ucuugaaggc uugagccaag. 4020 
aucucaggug cgaagccauu gaagauguug uuuugcuucu guugcuuucg gccuuguagc 4080 
cauuccugcc cuuguggguu guuuccggcu aucaaaaaug gucuaagguu gcggucaagc. 4140" 
ugguucuggu ugcuggcgag auccgcggcu gcaacaagaa ugagaggcuc auiiuccauug 4200 
uuguagaacc auugagcuac accagauggu guugcaaugg ugucaccgca ccguaggugc 4260 
ucuacuuucu ggugcauguc acggaacccu ugacucugac ccugaccuug accuucucca 4320 
aauaccggug acuccaugaa cgucucggcg caucccggaa uaacucuucc cauuagaccc 4380 
cuuccgugaa caacaaacgu gaguuugccg gcguucaaga aagugggcaa gaaaagaccc 4440 
ugacucgagc augcau 4456 

<210> 87 
<211> 33 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der 3cunst lichen Sequenz: 
oligonucleotide primer 

<400> 87 

aaaaggcctg tgttccattt ggccggaaac aac 33 

<210> 88 
<211> 31 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiins t lichen .Sequenz : 
oligonucleotide primer 

<400> 88 

aaagatatca ccctggagaa cgccacgagt g 31 

<210> 89 
<211> 33 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotide primer 



<400> 89 

aaaaggccta tggctaacaa gctcttcctc gtc 



33 
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<210> 90 
<211> 32 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kttnstlichen Sequenz: 
oligonucleotide primer 

<400> 90 

aaagatatcc tagtagtaag gagggaagaa ag 32 

<210> 91 
<2il> 32 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotide primer 

<400> 91 

ccgctcgagc tcagggtctt ttcttgccca ct 32 

<210> 92 
. <211> 32 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotide primer 

<400> 92 

ccggtcgacc tagtagtaag gagggaagaa ag 32 

<210> 93 
<211> 1500 
<212> DNA 

<213> Arabidopsis thaliana 

<220> 

<221> CDS 

<222> (1) . . (1497) 

<223> globuline-like protein 

<400> 93 

atg act aga ttt gcg gta ttg cca etc tct gtt ctt ctt etc gtt etc 48 

Met Thr Arg Phe Ala Val Leu Pro Leu Ser Val Leu Leu Leu Val Leu 
15 10 15 

ttg ttc etc tgc act gag teg ttg get aag teg gag gag tct gaa gaa 96 
Leu Phe Leu Cys Thr Glu Ser Leu Ala Lys Ser Glu Glu Ser Glu Glu 
20 25 30 

tac gac gtc get gtg cct tea tgt tgc ggg ttt teg tct cct ctt ctg 144 
Tyr Asp Val Ala Val Pro Ser Cys Cys Gly Phe Ser Ser Pro Leu Leu 
35 40 45 

att aag aaa gat caa tgg aaa cca ate ttc gag acg aag ttt gga cag 192 
lie Lys Lys Asp Gin Trp Lys Pro lie Phe Glu Thr Lys Phe Gly Gin 
50 55 60 

ate tea acc gtt caa ate ggc aat gga tgc ggt gga atg gga cct tac 240 
lie Ser Thr Val Gin lie Gly Asn Gly Cys Gly Gly Met Gly Pro Tyr 
65 70 75 80 
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aag ata cat tec ata acg ttg gag cca aac aca att ttg etc cct ctt 288 

Lys lie His Ser lie Thr Leu Glu Pro Asn Thr lie Leu Leu Pro Leu 
85 90 95 

ctt ctt cat tec gac atg gtc ttc ttc gtt gac tct gga agt ggg att 336 
Leu Leu His Ser Asp Met Val Phe Phe Val Asp Ser Gly Ser Gly He 
100 105 110 

ctg aat tgg gtt gac gag gaa gcg aag agt acc gag ate aga eta gga 384 
Leu Asn Trp Val Asp Glu Glu Ala Lys Ser Thr Glu He Arg Leu Gly 
115 120 125 

gac gtt tac agg eta cgt ccc ggt teg gtt ttc tac tta cag age aaa 432 
Asp Val Tyr Arg Leu Arg Pro Gly Ser Val Phe Tyr Leu Gin Ser Lys 
130 135 140 

ccg gat cct tgc ttt ggt gec tat teg agt ate aca gat eta atg ttt 480 
Pro Asp Pro Cys Phe Gly Ala Tyr Ser Ser He Thr Asp Leu Met Phe 
145 ~ 150 155 160 

ggt ttt gat gag aca att etc cag tea get ttt ggg gtt cct gag ggg 528 
Gly Phe Asp Glu Thr He Leu Gin Ser Ala Phe Gly Val Pro Glu Gly 
165 170 175 

att ata gag ctg atg agg aac cgt acg aag cca cca ttg ate gtg agt 576 
He He Glu Leu Met Arg Asn Arg Tlir Lys Pro Pro Leu He Val Ser 
180 185 190 

gag acg ctt tgc aca cca ggt gtg gee aac act tgg cag etc caa ccg 624 
Glu Thr Leu Cys Thr Pro Gly Val Ala Asn Thr Trp Gin Leu Gin Pro 
195 200 205 

cga tta eta aag etc ttt get gga agt gca gac ttg gtg gat aac aag 672 
Arg Leu Leu Lys Leu Phe Ala Gly Ser Ala Asp Leu Val Asp Asn Lys 
210 215 220 

aag aag aaa gag aag aaa gag aag aag gag aag gtg aag aaa gcg aag 720 
Lys Lys Lys Glu Lys Lys Glu Lys Lys Glu Lys Val Lys Lys Ala Lys 
225 230 235 240 

aca ttc aat gtt ttc gaa tct gaa ccg gat ttc gag age ccc tac ggt 768 
Thr Phe Asn Val Phe Glu Ser Glu Pro Asp Phe Glu Ser Pro Tyr Gly 
" 245 250 255 

cgt act ata acg att aac agg aag gat ctg aaa.-gtt tta aaa ggc tea .816 
Arg Thr He Thr He Asn Arg Lys Asp- Leu Lys Val Leu Lys Gly Ser 
260 265 270 

atg gtt gga gtt tec atg gtg aat etc act caa gga teg atg atg gga 864 
Met Val Gly Val Ser Met Val Asn Leu Thr Gin Gly Ser Met Met Gly 
275 280 285 

ccg cac tgg aat cca tgg get tgc gag att teg att gta ttg aaa gga 912 
Pro His Trp Asn Pro Trp Ala Cys Glu He Ser He Val Leu Lys Gly 
290 295 300 

gca gga atg gtt agg gtt ctt agg tct teg ata tea tea aac aca tea 960 
Ala Gly Met Val Arg Val Leu Arg Ser Ser He Ser Ser Asn Thr Ser 
305 310 315 320 

tea gag tgt aag aac gtg agg ttt aaa gta gag gaa gga gat att ttc 1008 
Ser Glu Cys Lys Asn Val Arg Phe Lys Val Glu Glu Gly Asp He Phe 
325 330 335 

gca gtt cca egg tta cat cca atg get caa atg tct ttc aac aat gac 1056 
Ala Val Pro Arg Leu His Pro Met Ala Gin Met Ser Phe Asn Asn Asp 
340 345 350 
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teg tta gtg ttc gtt ggg ttt act act tea get aag aat aac gag ccg 1104 
Ser Leu Val Phe Val Gly Phe Thr Thr Ser Ala Lys Asn Asn Glu Pro 
355 360 365 

cag ttc tta gee ggg gag gac teg get ttg egg atg ctt gac egg caa 1152 
Gin Phe Leu Ala Gly Glu Asp Ser Ala Leu Arg Met Leu Asp Arg Gin 
370 375 380 

gta ttg get gca teg ctt aat gtg agt agt gtg acg att gat gga ttg 1200 
Val Leu Ala Ala Ser Leu Asn Val Ser Ser Val Thr .lie Asp Gly Leu 
385 390 395 400 

ttg gga get cag aag gaa get gtt ate ttg gaa tgt cat tct tgt gcg 1248 
Leu Gly Ala Gin Lys Glu Ala Val lie Leu Glu Cys His Ser Cys Ala 
405 410 415 

gaa gga gag ata gag aag ctt aag gtg gag ata gag agg aag aaa ata 1296 
Glu Gly Glu lie Glu Lys Leu Lys Val Glu lie Glu Arg Lys Lys lie 
420 425 430 

gat gat gag agg aag agg aga cat gat gaa agg aag aaa gaa gaa gaa 1344 
Asp Asp Glu Arg Lys Arg Arg His Asp Glu Arg Lys Lys Glu Glu Glu 
435 440 445 

gag gcg aag aga gaa gag gaa gag agg agg aaa cgt gaa gaa gaa gaa 1392 
Glu Ala Lys Arg Glu Glu Glu Glu Arg Arg Lys Arg Glu Glu Glu Glu 
450 455 460 

gag aag aag egg tgg cca cct caa caa cca cca caa gaa gaa gaa ctt 1440 
Glu Lys Lys Arg Trp Pro Pro Gin Gin Pro Pro Gin Glu Glu Glu Leu 
465 470 475 480 

agg gaa egg caa eta ccg atg gag aaa gaa tgg gaa atg gaa ggt gaa 1488 
Arg Glu Arg Gin Leu Pro Met Glu Lys Glu Trp Glu Met Glu Gly Glu 
485 " 490 495 

gag gag agt taa 1500 
Glu Glu Ser 

<210> 94 
<211> 499 
<212> PRT 

<213> Arabidopsis thaliana 
<400> 94 

Met Thr Arg Phe Ala" Val Leu Pro Leu Ser Val Leu Leu Leu Val Leu 
15 10 15 

Leu Phe Leu Cys Thr Glu Ser Leu Ala Lys Ser Glu Glu Ser Glu Glu 
20 25 30 

Tyr Asp Val Ala Val Pro Ser Cys Cys Gly Phe Ser Ser Pro Leu Leu 
35 40 45 

He Lys Lys Asp Gin Trp Lys Pro He Phe Glu Thr Lys Phe Gly Gin 
50 55 60 

He Ser Thr Val Gin He Gly Asn Gly Cys Gly Gly Met Gly Pro Tyr 
65 70 75 80 

Lys He His Ser He Thr Leu Glu Pro Asn Thr He Leu Leu Pro Leu 
85 90 95 

Leu Leu His Ser Asp Met Val Phe Phe Val Asp Ser Gly Ser Gly He 
100 105 110 



Leu Asn Trp Val Asp Glu Glu Ala Lys Ser Thr Glu He Arg Leu Gly 
115 120 125 
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Asp Val Tyr Arg Leu Arg Pro Gly Ser Val Phe Tyr Leu Gin Ser Lys 
130 135 140 

Pro Asp Pro Cys Phe Gly Ala Tyr Ser Ser lie Thr Asp Leu Met Phe 
145 150 155 160 

Gly Phe Asp Glu Thr lie Leu Gin Ser Ala Phe Gly Val Pro Glu Gly 
165 170 175 

lie lie Glu Leu Met Arg Asn Arg Thr Lys Pro Pro Leu He Val Ser 
180 185 190 

Glu Thr Leu Cys Thr Pro Gly Val Ala Asn Thr Trp Gin Leu Gin Pro 
195 200 205 

Arg Leu Leu Lys Leu Phe Ala Gly Ser Ala Asp Leu Val Asp Asn Lys 
210 215 220 

Lys Lys Lys Glu Lys Lys Glu Lys Lys Glu Lys Val Lys Lys Ala Lys 

225 • 230 235 240 

Thr Phe Asn Val Phe Glu Ser Glu Pro Asp Phe Glu Ser Pro Tyr Gly 
245 250 255 

Arg Thr He Thr He Asn Arg Lys Asp Leu Lys Val Leu Lys Gly Ser 
260 265 270 

Met Val Gly Val Ser Met Val Asn Leu Thr Gin Gly Ser Met Met Gly 
275 280 285 

Pro His Trp Asn Pro Trp Ala Cys Glu He Ser He Val Leu Lys Gly 
290 295 300 

Ala Gly Met Val Arg Val Leu Arg Ser Ser He Ser Ser Asn Thr Ser 
305 310 315 320 

Ser Glu Cys Lys Asn Val Arg Phe Lys Val Glu Glu Gly Asp He Phe 
325 330 335 

Ala Val Pro Arg Leu His Pro Met Ala Gin Met Ser Phe Asn Asn Asp 
340 345 350 

Ser Leu Val Phe Val Gly Phe Thr Thr Ser Ala Lys Asn Asn Glu Pro 
355 360 365 

Gin Phe Leu Ala Gly Glu Asp Ser Ala Leu Arg Met Leu Asp Arg Gin 
370 375 380 ' 

Val Leu Ala Ala Ser Leu Asn Val Ser Ser Val Thr He Asp Gly Leu 
385 390 395 400 

Leu Gly Ala Gin Lys Glu Ala Val He Leu Glu Cys His Ser Cys Ala 
405 410 415 

Glu Gly Glu He Glu Lys Leu Lys Val Glu He Glu Arg Lys Lys He 
420 425 430 

Asp Asp Glu Arg Lys Arg Arg His Asp Glu Arg Lys Lys Glu Glu Glu 
435 440 445 

Glu Ala Lys Arg Glu Glu Glu Glu Arg Arg Lys Arg Glu Glu Glu Glu 
450 455 460 

Glu Lys Lys Arg Trp Pro Pro Gin Gin Pro Pro Gin Glu Glu Glu Leu 
465 470 475 480 

Arg Glu Arg Gin Leu Pro Met Glu Lys Glu Trp Glu Met Glu Gly Glu 
485 490 495 

Glu Glu Ser 
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<210> 95 
<211> 1284 
<212> DNA 
<213> Glycine max 

<220> 

<221> CDS 

<222> (1) (1281) 

<223> 7S seed globuline 

<400> 95 

atg get tec ate etc cac tac ttt tta gec etc tct ctt tct tgc tct 48 

Met Ala Ser lie Leu His Tyr Phe Leu Ala Leu Ser Leu Ser Cys Ser 
1 5 10 15 

ttt ctt ttc ttc tta tec gac tea gtc acc cct aca aaa cca ata aac 96 
Phe Leu Phe Phe Leu Ser Asp Ser Val Thr Pro Thr Lys Pro lie Asn 
20 25 30 

ctt gtt gtt eta ccc gtt caa aat gat ggt tec aca ggg etc cat teg 144 
Leu Val Val Leu Pro Val' Gin Asn Asp Gly Ser Thr Gly Leu His Ser 

35 40 -45 

gec aac etc caa aaa aga acc cct eta atg caa gta cca gtc ctg gtg 
Ala Asn Leu Gin Lys Arg Thr Pro Leu Met Gin Val Pro Val Leu Val 

50 55 60 

gac etc aat gga aat cac ttg tgg gtt aac tgt gag cag cag tac tea 
Asp Leu Asn Gly Asn His Leu Trp Val Asn Cys Glu Gin Gin Tyr Ser 
65 70 75 80 

tec aaa acg tac caa gca ccc ttc tgc cac tec acc caa tgc tct aga 
Ser Lys Thr Tyr Gin Ala Pro Phe Cys His Ser Thr Gin Cys Ser Arg 
85 90 95 

gec aac acc cac caa tgc etc agt tgc ccc gcg gca tea agg cca ggg 336 
Ala Asn Thr His Gin Cys Leu Ser Cys Pro Ala Ala Ser Arg Pro Gly 

100 105 110 

tgc cac aaa aac acg tgt ggc etc atg tec act aat ccc ate acc caa 3 84 
Cys His Lys Asn Thr Cys Gly Leu Met Ser Thr Asn Pro lie Thr Gin 

115 120 125 

caa acc ggt tta ggt gaa eta gga gaa gac gtt ctt gca ate cac gee 432 
Gin Thr Gly Leu Gly Glu Leu Gly Glu Asp Val Leu Ala He His Ala 

130 - 1 135 140 

aca caa ggg teg acc caa caa ctt ggc cca ttg gtc aca gtc cca caa 480 
Thr Gin Gly Ser Thr Gin Gin Leu Gly Pro Leu Val Thr Val Pro Gin 
145 " 150 155 160 

ttc etc ttt tct tgt gca cct tec ttc ctt gtt caa aag ggt ctt cct 528 
Phe Leu Phe Ser Cys Ala Pro Ser Phe Leu Val Gin Lys Gly Leu Pro 
165 170 175 

aga aac act caa ggt gtg get ggg tta ggc cat gca cca att tct ctt 576 
Arg Asn Thr Gin Gly Val Ala Gly Leu Gly His Ala Pro He Ser Leu 
180 185 190 

cca aac caa etc get tec cac ttt ggc eta caa cgc caa ttc acc act 624 
Pro Asn Gin Leu Ala Ser His Phe Gly Leu Gin Arg Gin Phe Thr Thr 
195 200 205 



192 



240 



288 



tgc ctt tct cgc tac cct act tea aag ggt get ata ata ttc ggg gat 
Cys Leu Ser Arg Tyr Pro Thr Ser Lys Gly Ala He He Phe Gly Asp 
210 215 220 



672 
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gca cct aac aac atg cga cag ttt caa aac caa gat att ttc cac gat 720 

Ala Pro Asn Asn Met Arg Gin Phe Gin Asn Gin Asp lie Phe His Asp 
225 230 235 240 

ttg gcc ttc acc cca tta acc ate acc ctg cag gga gag tac aac gtg 768 
Leu Ala Phe Thr Pro Leu Thr He Thr Leu Gin Gly Glu Tyr Asn Val 
245 250 255 

aga gtc aac tea ata aga ate aac cag cac agt gtg ttc cca ctg aac 816 
Arg Val Asn Ser He Arg He Asn Gin His Ser Val Phe Pro Leu Asn 
260 265 270 

aag ata tea tec acc ate gta ggg teg acc tct gga gga acc atg att 864 
Lys He Ser Ser Thr He Val Gly Ser Thr Ser Gly Gly Thr Met He 
275 280 '285 

age acc tea act cct cac atg gtt etc cag caa tec gtg tac cag get 912 
Ser Thr Ser Thr Pro His Met Val Leu Gin Gin Ser Val Tyr Gin Ala 
290 295 300 

ttc act cag gtg ttt get cag cag eta cca aag caa gca cag gtg aaa 960 
Phe Thr Gin Val Phe Ala Gin Gin Leu Pro Lys Gin Ala Gin Val Lys 
305 310 315 320 

tct gtg gca cca ttt ggg tta tgc ttc aac tec aac aag ate aat gca 1008 
Ser Val Ala Pro Phe Gly Leu Cys Phe Asn Ser Asn Lys He Asn Ala . 

325 330 335 

tat cct age gtg gac ctt gtg atg gac aag ccc aat ggt cct gtt tgg 1056 
Tyr Pro Ser Val Asp Leu Val Met Asp Lys Pro Asn Gly Pro Val Trp 
340 345 350 

aga ate tct ggt gag gac ttg atg gtg cag gca caa cct ggg gtc acg 1104 
Arg He Ser Gly Glu Asp Leu Met Val Gin Ala Gin Pro Gly Val Thr 
355 360 3 65 

tgt ttg ggt gtt atg aat gga gga atg caa cct aga get gaa att acc 1152 
Cys Leu Gly Val Met Asn Gly Gly Met Gin Pro Arg Ala Glu He Thr 
370 375 380 

tta ggg gca cgt cag ttg gaa gag aac ctg gtg gtg ttc gat ctt gca 1200 
Leu Gly Ala Arg Gin Leu Glu Glu Asn Leu Val Val Phe Asp Leu Ala 
385 . 390 395 . 400 

agg tea agg gtt ggg ttt age acc tea tea ctg cac teg cat gga gtc 1248 
Arg Ser Arg Val Gly Phe Ser Thr Ser Ser Leu His Ser His Gly Val 
405 410 415 

aaa tgt. get gac etc ttc aac ttt gcc aat gca tga 1284 
Lys Cys Ala Asp Leu Phe Asn Phe Ala Asn Ala 
420 425 

<210> 96 

<211> 427 

<212> PRT 

<213> Glycine max 

<400> 96 

Met Ala Ser He Leu His Tyr Phe Leu Ala Leu Ser Leu Ser Cys Ser 
1 5 10 15 

Phe Leu Phe Phe Leu Ser Asp Ser Val Thr Pro Thr Lys Pro He Asn 
20 25 30 



Leu Val Val Leu Pro Val Gin Asn Asp Gly Ser Thr Gly Leu His Ser 
35 40 45 
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Ala Asn Leu Gin Lys Arg Thr Pro Leu Met Gin Val Pro Val Leu Val 
50 55 60 

Asp Leu Asn Gly Asn His Leu Trp Val Asn Cys Glu Gin Gin Tyr Ser 
65 70 75 80 

Ser Lys Thr Tyr Gin Ala Pro Phe Cys His Ser Thr Gin Cys Ser Arg 
85 90 95 

Ala Asn Thr His Gin Cys Leu Ser Cys Pro Ala Ala Ser Arg Pro Gly 
100 105 110 

Cys His Lys Asn Thr Cys Gly Leu Met Ser Thr Asn Pro lie Thr Gin 
115 120 125 

Gin Thr Gly Leu Gly Glu Leu Gly Glu Asp Val Leu Ala He His Ala 
130 135 140 

Thr Gin Gly Ser Thr Gin Gin Leu Gly Pro Leu Val Thr Val Pro Gin 
145 150 155 160 

Phe Leu Phe Ser Cys Ala Pro Ser Phe Leu Val Gin Lys Gly Leu Pro 
165 170 175 

Arg Asn Thr Gin Gly Val Ala Gly Leu Gly His Ala Pro He Ser Leu 
180 185 190 

Pro Asn Gin Leu Ala Ser His Phe Gly Leu Gin Arg Gin Phe Thr Thr 
195 200 205 

Cys Leu Ser Arg Tyr Pro Thr Ser Lys Gly Ala He He Phe Gly Asp 
210 215 220 

Ala Pro Asn Asn Met Arg Gin Phe Gin Asn Gin Asp He Phe His Asp 
225 230 235 240 

Leu Ala Phe Thr Pro Leu Thr He Thr Leu Gin Gly Glu Tyr Asn Val 
245 250 255 

Arg Val Asn Ser He Arg He Asn Gin His Ser Val Phe Pro Leu Asn 
260 265 270 

Lys He Ser Ser Thr He Val Gly Ser Thr Ser Gly Gly Thr Met He 
275 280 285 

Ser Thr Ser Thr Pro His Met Val Leu Gin Gin Ser Val Tyr Gin Ala 
290 295 300 

Phe Thr Gin Val Phe Ala Gin Gin Leu Pro Lys Gin Ala Gin Val Lys 
305 310 315 320 

Ser Val Ala Pro Phe Gly Leu Cys Phe Asn Ser Asn Lys He Asn Ala 
325 330 335 

Tyr Pro Ser Val Asp Leu Val Met Asp Lys Pro Asn Gly Pro Val Trp 
340 345 350 

Arg He Ser Gly Glu Asp Leu Met Val Gin Ala Gin Pro Gly Val Thr 
355 360 365 

Cys Leu Gly Val Met Asn Gly Gly Met Gin Pro Arg Ala Glu He Thr 
370 375 380 

Leu Gly Ala Arg Gin Leu Glu Glu Asn Leu Val Val Phe Asp Leu Ala 
385 • 390 395 400 

Arg Ser Arg Val Gly Phe Ser Thr Ser Ser Leu His Ser His Gly Val 
405 410 415 

Lys Cys Ala Asp Leu Phe Asn Phe Ala Asn Ala 
420 425 
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<210> 97 
<211> 814 
<212> DNA 
<213> Zea mays 

<220> 
<221> CDS 
<222> (1) . . (720) 
<223> 19kd zein 

<400> 97 

atg gca gcc aag att ttt gcc etc ctt gec etc ctt get ctt tea gca 48 

Met Ala Ala Lys lie Phe Ala Leu Leu Ala Leu Leu Ala Leu Ser Ala 
15 10 15 

aac gtt get acc gcg act att att cca caa tgc tea caa caa tac etc 96 
Asn Val Ala Thr Ala Thr lie lie Pro Gin Cys Ser Gin Gin Tyr Leu 
20 25 30 

tct ccg gtg aca gcc gcg aga ttt gaa tac cca act ata caa tec tac 144 
Ser Pro Val Thr Ala Ala Arg Phe Glu Tyr Pro Thr lie Gin Ser Tyr 
35 40 45 

agg eta caa cag gcc ate gca gca age ate tta egg teg tta gca ttg 192 
Arg Leu Gin Gin Ala lie Ala Ala Ser lie Leu Arg Ser Leu Ala Leu 
50 55 60 

act gtc caa caa cca tat gcc eta ttg caa caa cca tec tta gtg aat 240 
Thr Val Gin Gin Pro Tyr Ala Leu Leu Gin Gin Pro Ser Leu Val Asn 
65 70 75 80 

eta tat etc caa aga ate gta gca caa caa eta caa caa caa ttg ctt 288 
Leu Tyr Leu Gin Arg He Val Ala Gin Gin Leu Gin Gin Gin Leu Leu 
85 90 95 

cca aca ate aat gaa gta gtt gca gcg aac ctt gat get tac etc cag 336 
Pro Thr He Asn Glu Val Val Ala Ala Asn Leu Asp Ala Tyr Leu Gin 
100 105 110 

caa caa caa ttt ctt cca ttc aat caa eta get ggg gtg aac cct get 384 
Gin Gin Gin Phe Leu Pro Phe Asn Gin Leu Ala Gly Val Asn Pro Ala 
115 120 125 

get tac ttg cag gca caa cag eta eta cca ttc aac caa ctt gtc agg 432 
Ala Tyr Leu Gin Ala Gin Gin Leu Leu Pro Phe Asn Gin Leu Val Arg 
130 135 140 

age cct get gcc ttc tta ctg cag caa cag ttg ttg cca ttc cat eta 480 
Ser Pro Ala Ala Phe Leu Leu Gin Gin Gin Leu Leu Pro Phe His Leu 
145 150 155 160 

caa gtt gtg gca aac att get get ttc ttg caa caa caa caa ttg ctg 528 
Gin Val Val Ala Asn He Ala Ala Phe Leu Gin Gin Gin Gin Leu Leu 
165 170 175 

cca ttt tac cca cag gtt gtg gga aac att aac gcc ttc ttg caa cag 576 
Pro Phe Tyr Pro Gin Val Val Gly Asn He Asn Ala Phe Leu Gin Gin 
180 185 190 

caa cag ttg ctg cca ttc tac cca cag gat gtg gca aac aat gtc gcc 624 
Gin Gin Leu Leu Pro Phe Tyr Pro Gin Asp Val Ala Asn Asn Val Ala 
195 200 205 

ttc tta caa caa caa caa ttg ctg cca ttt age caa ctt get ttg acg ' 672 
Phe Leu Gin Gin Gin Gin Leu Leu Pro Phe Ser Gin Leu Ala Leu Thr 
210 215 220 
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aat cct acc acc tta ttg cag cag ccc acc att ggt ggt gcc ate ttc 720 

Asn Pro Thr Thr Leu Leu Gin Gin Pro Thr lie Gly Gly Ala lie Phe 
225 230 235 240 

tagatttttt atgetttata ctgtaataat aaagttctca tactgatatg tgeaacttet 780 

cagtaataaa agattagaga tctatatttt atta 814 

<210> 98 

<211> 240 

<212> PRT 

<213> Zea mays 

<400> 98 

Met Ala Ala Lys lie Phe Ala Leu Leu Ala Leu Leu Ala Leu Ser Ala 
15 10 15 

Asn Val Ala Thr Ala Thr lie He Pro Gin Cys Ser Gin Gin Tyr Leu 
20 25 30 

Ser Pro Val Thr Ala Ala Arg Phe Glu Tyr Pro Thr He Gin Ser Tyr 
35 40 45 

Arg Leu Gin- Gin Ala He Ala Ala Ser He Leu Arg Ser Leu Ala Leu 
50 55 60 

Thr Val Gin Gin Pro Tyr Ala Leu Leu Gin Gin Pro Ser Leu Val Asn 
65 70 75 80 

Leu Tyr Leu Gin Arg He Val Ala Gin Gin Leu Gin Gin Gin Leu Leu 
.85 90 95 

Pro Thr He Asn Glu Val Val Ala Ala Asn Leu Asp Ala Tyr Leu Gin 
100 105 110 

Gin Gin Gin Phe Leu Pro Phe Asn Gin Leu Ala Gly Val Asn Pro Ala 
115 120 125 

Ala Tyr Leu Gin Ala Gin Gin Leu Leu Pro Phe Asn Gin Leu Val Arg 
130 135 140 

Ser Pro Ala Ala Phe Leu Leu Gin Gin Gin Leu Leu Pro Phe His Leu 
145 150 155 160 

Gin Val Val Ala Asn He Ala Ala Phe Leu Gin Gin Gin Gin Leu Leu 
165 170 175 

Pro Phe Tyr Pro Gin Val Val Gly Asn He Asn Ala Phe Leu Gin Gin 
180 185 190 

Gin Gin Leu Leu Pro Phe Tyr Pro Gin Asp Val Ala Asn Asn Val Ala 
195 200 205 

Phe Leu Gin Gin Gin Gin Leu Leu Pro Phe Ser Gin Leu Ala Leu Thr 
210 215 220 

Asn Pro Thr Thr Leu Leu Gin Gin Pro Thr He Gly Gly Ala He Phe 
225 230 235 240 



<210> 99 
<211> 705 
<212> DNA 
<213> Zea mays 

<220> 

<221> CDS 

<222> (1)..{702) 

<223> 19 kd zein Bl 
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48 



96 



<400> 99 

atg gca gcc aaa ata ttt tgc etc ctt atg etc ctt ggt ctt tct gca 
Met Ala Ala Lys lie Phe Cys Leu Leu- Met Leu Leu Gly Leu Ser Ala 

1 5 10 15 

agt get get acg gcg acc att ttc cca caa tgc tea caa get cct ata 
Ser Ala Ala Thr Ala Thr He Phe Pro Gin Cys Ser Gin Ala Pro He 

20 25 30 

get tec ctt ctt ccc ccg tac etc tea cca gcg gtg tct teg gta tgt 144 
Ala Ser Leu Leu Pro Pro Tyr Leu Ser Pro Ala Val Ser Ser Val Cys 

35 40 45 

gaa aac cca att ctt caa ccc tat agg ate caa cag gca ate gca get 192 
. Glu Asn Pro He Leu Gin Pro Tyr Arg He Gin Gin Ala He Ala Ala 
50 55 60 

ggc ate tta cct tta tea ccc ttg ttc etc caa caa tea tea gcc eta 240 
Gly He Leu Pro Leu Ser Pro Leu Phe Leu Gin Gin Ser Ser Ala Leu 
65 70 75 80 

tta cag cag tta cct ttg gtg cat tta ttg gca caa aac ate agg gca 288 
Leu Gin Gin Leu Pro Leu Val His Leu Leu Ala Gin Asn He Arg Ala 

85 90 95 

caa caa eta caa caa ctt gtg eta gca aac ctt get gcc tac tct cag 336 
Gin Gin Leu Gin Gin Leu Val Leu Ala Asn Leu Ala Ala Tyr Ser Gin 

100 105 HO 

caa caa cag ttt ctt cca ttc aac caa eta get gca ttg aac tct get 384 
Gin Gin Gin Phe Leu Pro Phe Asn Gin Leu Ala Ala Leu Asn Ser Ala 

115 120 125 

tct tat ttg caa caa caa caa eta cca ttc age cag eta tct get gcc 432 
Ser Tyr Leu Gin Gin Gin Gin Leu Pro Phe Ser Gin Leu Ser Ala Ala 

130 135 140 

tac ccc cag caa ttt ctt cca ttc aac caa ctg aca get ttg aac tct 480 
Tyr Pro Gin Gin Phe Leu Pro Phe Asn Gin Leu Thr Ala Leu Asn Ser 
145 150 155 160 

cct get tat tta cag cag caa caa eta eta cca ttc age cag eta get 528 
Pro Ala Tyr Leu Gin Gin Gin Gin Leu Leu Pro Phe Ser Gin Leu Ala 

165 170 175 

ggt gtg age cct get acc ttc ttg aca caa cca caa ttg ttg ccg ttc 
Gly Val Ser Pro Ala Thr Phe Leu Thr Gin Pro Gin Leu Leu Pro Phe 

180 185 190 

tac cag cac get gcg cct aac get ggc acc etc tta caa ctg caa caa 624 
Tyr Gin His Ala Ala Pro Asn Ala Gly Thr Leu Leu Gin Leu Gin Gin 

195 200 205 

ttg ctg cca ttc aac caa ctt get ttg aca aac cca aca gca ttc tac 672 
Leu Leu Pro Phe Asn Gin Leu Ala Leu Thr Asn Pro Thr Ala Phe Tyr 

210 215 220 

caa caa ccc ate att ggt ggt gcc etc ttt tag 705 
Gin Gin Pro He He Gly Gly Ala Leu Phe 
225 230 

<210> 100 
<211> 234 
<212> PRT 
<213> Zea mays 

<400> 100 

Met Ala Ala Lys He Phe Cys Leu Leu Met Leu Leu Gly Leu Ser Ala 
! 5 10 15 



576 
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Ser Ala Ala Thr Ala Thr lie Phe Pro Gin Cys Ser Gin Ala Pro lie 
20 25 30 

Ala Ser Leu Leu Pro Pro Tyr Leu Ser Pro Ala Val Ser Ser Val Cys 
35 40 45 

Glu Asn Pro lie Leu Gin Pro Tyr Arg lie Gin Gin Ala lie Ala Ala 
50 55 60 

Gly lie Leu Pro Leu Ser Pro Leu Phe Leu Gin Gin Ser Ser Ala Leu 
65 70 75 80 

Leu Gin Gin Leu Pro Leu Val His Leu Leu Ala Gin Asn lie Arg Ala 
85 90 95 

Gin Gin Leu Gin Gin Leu Val Leu Ala Asn Leu Ala Ala Tyr Ser Gin 
100 105 110 

Gin Gin Gin Phe Leu Pro Phe Asn Gin Leu Ala Ala Leu Asn Ser Ala 
115 120 125 

Ser Tyr Leu Gin Gin Gin Gin Leu Pro Phe Ser Gin Leu Ser Ala Ala 
. 130 135 140 

Tyr Pro Gin Gin Phe Leu Pro Phe Asn Gin Leu Thr Ala Leu Asn Ser 
145 150 . 155 160 

Pro Ala Tyr Leu Gin Gin Gin Gin Leu Leu Pro Phe Ser Gin Leu Ala 
165 170 175 

Gly Val Ser Pro Ala Thr Phe Leu Thr Gin Pro Gin Leu Leu Pro Phe 
180 . 185 190 

Tyr Gin His Ala Ala Pro Asn Ala Gly Thr Leu Leu Gin Leu Gin Gin 
195 200 205 

Leu Leu Pro Phe Asn Gin Leu Ala Leu Thr Asn Pro Thr Ala Phe Tyr 
210 215 220 

Gin Gin Pro lie lie Gly Gly Ala Leu Phe 
225 230 



<210> 101 
<211> 804 
<212> DNA 
<213> Zea mays 

<220> 

<221> CDS 

<222> (1) . . (801) 

<223> 19 kd zein B2 

<400> 101 

atg gca gcc aaa ata ttt tgc etc att atg etc ctt ggt ctt tct gca 48 

Met Ala' Ala Lys lie Phe Cys Leu lie Met Leu Leu Gly Leu Ser Ala 
15 10 15 

agt get get acg gcg age att ttc ccg caa tgc tea caa get cct ata 96 
Ser Ala Ala Thr Ala Ser lie Phe Pro Gin Cys Ser Gin Ala Pro lie 
20 25 30 

get tec ctt ctt ccc cca tac etc tea cca gcg atg tct tea gta tgt 144 
Ala Ser Leu Leu Pro Pro Tyr Leu Ser Pro Ala Met Ser Ser Val Cys 
35 40 45 

gaa aat cca att ctt eta ccc tac agg ate caa cag gca ate gca gca 192 
Glu Asn Pro lie Leu Leu Pro Tyr Arg lie Gin Gin Ala lie Ala Ala 
50 55 60 
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ggc ate tta cct tta tea ccc ttg ttc etc caa caa tea tea gee eta 240 

Gly lie Leu Pro Leu Ser Pro Leu Phe Leu Gin Gin Ser Ser Ala Leu 
65 70 75 80 

tta cag cag tta cct ttg gtg cat tta ttg gca caa aac ate agg gca 288 
Leu Gin Gin Leu Pro Leu Val His Leu Leu Ala Gin Asn lie Arg Ala 
85 90 95 

caa caa eta caa caa etc gtg eta gca aac ctt get gee tac tct cag 336 
Gin Gin Leu Gin Gin Leu Val Leu Ala Asn Leu Ala Ala Tyr Ser Gin 
100 105 110 

caa cag cag tta cct ttg gtg cat ttg ttg gca caa aac ate agg gca 384 
Gin Gin Gin Leu Pro Leu Val His Leu Leu Ala Gin Asn lie Arg Ala 
115 120 125 

caa caa eta caa caa etc gtg eta gca aac ctt get gee tac tct cag 432 
Gin Gin Leu Gin Gin Leu Val Leu Ala Asn Leu Ala Ala Tyr Ser Gin 
130 135 140 

caa caa cag ttt ctg cca ttc aac caa eta get gca ttg aac tct get 480 
Gin Gin Gin Phe Leu Pro Phe Asn Gin Leu Ala Ala Leu Asn Ser Ala 
145 150 155 160 

get tat ttg cag caa caa caa eta eta cca ttc age cag eta get get 528 
Ala Tyr Leu Gin Gin Gin Gin Leu Leu Pro Phe Ser Gin Leu Ala Ala 
165 170 175 

gee tac ccc egg caa ttt ctt cca ttc aac caa ctg gca gca ttg aac 576 
Ala Tyr Pro Arg Gin Phe Leu Pro Phe Asn Gin Leu Ala Ala Leu Asn 
180 185 190 

tct cat get tat gta caa caa caa caa eta eta cca ttc age cag eta 624 
Ser His Ala Tyr Val Gin Gin Gin Gin Leu Leu Pro Phe Ser Gin Leu 
195 200 205 

get get gtg age cct get gee ttc ttg aca cag caa cat ttg ttg ccg 672 
Ala Ala Val Ser Pro Ala Ala Phe Leu Thr Gin Gin His Leu Leu Pro 
210 215 220 

ttc tac ctg cac act gcg cct aac gtt ggc ace etc tta caa ctg caa 720 
Phe Tyr Leu His Thr Ala Pro Asn Val Gly Thr Leu Leu Gin Leu Gin 
225 " 230 235 240 

caa ttg ctg cca ttc gac caa ctt get ttg aca aac cca gca gtg ttc 768 
Gin Leu Leu Pro Phe Asp Gin Leu Ala Leu Thr Asn Pro Ala Val Phe 
245 250 255 

tac caa caa ccc ate att ggt ggt gec etc ttt tag 804 
Tyr Gin Gin Pro lie lie Gly Gly Ala Leu Phe 
260 265 

<210> 102 
<211> 267 
<212> PRT 
<213> Zea mays 

<400> 102 

Met Ala Ala Lys He Phe Cys Leu He Met Leu Leu Gly Leu Ser Ala 
1 5 10 15 

Ser Ala Ala Thr Ala Ser He Phe Pro Gin Cys Ser Gin Ala Pro He 
20 25 30 



Ala Ser Leu Leu Pro Pro Tyr Leu Ser Pro Ala Met Ser Ser Val Cys 
35 40 45 
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Glu Asn Pro lie Leu Leu Pro Tyr Arg He Gin Gin Ala He Ala Ala 
50 55 60 

Gly He Leu Pro Leu Ser Pro Leu Phe Leu Gin Gin Ser Ser Ala Leu 
65 70 75 80 

Leu Gin Gin Leu Pro Leu Val His Leu Leu Ala Gin Asn He Arg Ala 
85 90 95 

Gin Gin Leu Gin Gin Leu Val Leu Ala Asn Leu Ala Ala Tyr Ser Gin 
100 105 110 

Gin Gin Gin Leu Pro Leu Val His Leu Leu Ala Gin Asn He Arg Ala 
115 120 125 

Gin Gin Leu Gin Gin Leu Val Leu Ala Asn Leu Ala Ala Tyr Ser Gin 
130 135 140 

Gin Gin Gin Phe Leu Pro Phe Asn Gin Leu Ala Ala Leu Asn Ser Ala 
145 . 150 155 160 

Ala Tyr Leu Gin Gin Gin Gin Leu Leu Pro Phe Ser Gin Leu Ala Ala 
165 170 175 

Ala Tyr Pro Arg Gin Phe Leu Pro Phe Asn Gin Leu Ala Ala Leu Asn 
180 185 190 

Ser His Ala Tyr Val Gin Gin Gin Gin Leu Leu Pro Phe Ser Gin Leu 
195 200 205 

Ala Ala Val Ser Pro Ala Ala Phe Leu Thr Gin Gin His Leu Leu Pro 
210 215 220 

Phe Tyr Leu His Thr Ala Pro Asn Val Gly Thr Leu Leu Gin Leu Gin 
225 230 235 240 

Gin Leu Leu Pro Phe Asp Gin Leu Ala Leu Thr Asn Pro Ala Val Phe 
245 250 255 

Tyr Gin Gin Pro He He Gly Gly Ala Leu Phe 
260 265 



<210> 103 
<211> 801 
<212> DNA 
<213> Zea mays 

<220> 

<221> CDS 

<222> (1)..(798) 

<223> 22kd alpha-zein 

<400> 103 

atg get acc aag ata tta gec etc ctt gcg etc ctt tec ctt tea gtg 48 

Met Ala Thr Lys He Leu Ala Leu Leu Ala Leu Leu Ser Leu Ser Val 
15 10 15 

age gca aca act gca ttc att att cca caa tgc tea ctt get cct aat 96 
Ser Ala Thr Thr Ala Phe He He Pro Gin Cys Ser Leu Ala Pro Asn 
20 25 30 

gee att att cca cag ttc etc cca tea gtt aca tea atg ggc ate gaa 144 
Ala He He Pro Gin Phe Leu Pro Ser Val Thr Ser Met Gly He Glu 
35 40 45 

cac cct att gtg caa gee tat agg eta caa caa gcg ctt gcg gcg age 192 
His Pro He Val Gin Ala Tyr Arg Leu Gin Gin Ala Leu Ala Ala Ser 
50 55 60 
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gtc tta caa caa ccg ttt gcc caa tta caa caa caa tec ttg gca cat 240 
Val Leu Gin Gin Pro Phe Ala Gin Leu Gin Gin Gin Ser Leu Ala His 
65 70 75 80 

eta ace ata caa ace ate gca aca caa eta gag caa cag ttt gtg ccc 288 
Leu Thr lie Gin Thr lie Ala Thr Gin Leu Glu Gin Gin Phe Val Pro 
85 90 95 

gca ttg age caa eta gcc gcg gtg aac cct gtc tec tac ttg caa cag 336 
Ala Leu Ser Gin Leu Ala Ala Val Asn Pro Val Ser Tyr Leu Gin Gin 
100 105 110 

caa atg ctt gca tec aac cca ctt get ctg gcg aac aca gcc gca tac 384 
Gin Met Leu Ala Ser Asn Pro Leu Ala Leu Ala Asn Thr Ala Ala Tyr 
115 120 ' 125 

cag caa caa eta cag ttg caa cag ttt eta cca get ctt agt caa eta 432 
Gin Gin Gin Leu Gin Leu Gin Gin Phe Leu Pro Ala Leu Ser Gin Leu 
130 135 140 

gcc agg gtg aac cct gcc aca tac ctg caa cag caa caa ctg ctt tea 480 
Ala Arg- Val Asn Pro Ala Thr Tyr Leu Gin Gin Gin Gin Leu Leu Ser 
145 150 155 160 

tct age cca etc get gtg ggc aat gcg get aca tac ctg caa cag cag 528 
Ser Ser Pro Leu Ala Val Gly Asn Ala Ala Thr Tyr Leu Gin Gin Gin 
165 170 175 

ctg eta caa cag ate gta ccg get ctt agt cag eta gtt gtg gcg aac 576 
Leu Leu Gin Gin lie Val Pro Ala Leu Ser Gin Leu Val Val Ala Asn 
180 185 190 

cct act gcc tac tta caa cag ctt ctt cca ttc aac caa eta gat gtg 624 
Pro Thr Ala Tyr Leu Gin Gin Leu Leu Pro Phe Asn Gin Leu Asp Val 
195 200 205 

gca aac tct get gcg tac eta caa cag egg cag caa eta ctt aat cca 672 
Ala Asn Ser Ala Ala Tyr Leu Gin Gin Arg Gin Gin Leu Leu Asn Pro 
210 215 220 

ctt gca gcg get aac cca ttg gtc gcc gcc ttc ctg caa cag caa caa 720 
Leu Ala Ala Ala Asn Pro Leu Val Ala Ala Phe Leu Gin Gin Gin Gin 
225 230 235 240 

ttt ctg cca tac aac caa ate tct ttg atg aac ctt gcc ttg tea agg 768 
Phe Leu Pro Tyr Asn Gin lie Ser Leu Met Asn Leu. Ala Leu Ser Arg 
245 25.0 255 

cag caa ccg ate gtt gga ggt gcc ate ttt tag 801 
Gin Gin Pro He Val Gly Gly Ala He Phe 
260 265 

<210> 104 
<211> 266 
<212> PRT 
<213> Zea mays 

<400> 104 

Met Ala Thr Lys He Leu Ala Leu Leu Ala Leu Leu Ser Leu Ser Val 
15 10 15 

Ser Ala Thr Thr Ala Phe He He Pro Gin Cys Ser Leu Ala Pro Asn 
20 25 30 



Ala He He Pro Gin Phe Leu Pro .Ser Val Thr Ser Met Gly He Glu 
35 40 45 




WO 03/078629 PCT.'EP<i3'»r35 

108 

His Pro lie Val Gin Ala Tyr Arg Leu Gin Gin Ala Leu Ala Ala Ser 
50 55 60 

Val Leu Gin Gin Pro Phe Ala Gin Leu Gin Gin Gin Ser Leu Ala His 
65 70 75 80 

Leu Thr lie Gin Thr lie Ala Thr Gin Leu Glu Gin Gin "Phe Val Pro 
85 90 95 

Ala Leu Ser Gin Leu Ala Ala Val Asn Pro Val Ser Tyr Leu Gin Gin 
100 105 110 

Gin Met Leu Ala Ser Asn Pro Leu Ala Leu Ala Asn Thr Ala Ala Tyr 
115 120 125 

Gin Gin Gin Leu Gin Leu Gin Gin Phe Leu Pro Ala Leu Ser Gin Leu 
130 135 140 

Ala Arg Val Asn Pro Ala Thr Tyr Leu Gin Gin Gin Gin Leu Leu Ser 
145 150 155 160 

Ser Ser Pro Leu Ala Val Gly Asn Ala Ala Thr Tyr Leu Gin Gin Gin 
165 170 175 

Leu Leu Gin Gin lie Val Pro Ala Leu Ser Gin Leu Val Val Ala Asn 
180 185 190 

Pro Thr Ala Tyr Leu Gin Gin Leu Leu Pro Phe Asn Gin Leu Asp Val 
195 200 205 

Ala Asn Ser Ala Ala Tyr Leu Gin Gin Arg Gin Gin Leu Leu Asn Pro 
210 215 220 

Leu Ala Ala Ala Asn Pro Leu Val Ala Ala Phe Leu Gin Gin Gin Gin 
225 230 235 240 

Phe Leu Pro Tyr Asn Gin lie Ser Leu Met Asn Leu Ala Leu Ser Arg 
245 250 255 

Gin Gin Pro He Val Gly Gly Ala He Phe 
260 265 



<210> 105 
<211> 471 
<212> DNA 
<213> Oryza sativa 

<220> 
<221> CDS 
<222> (1) . . (468) 
<223> prolamin 

<400> 105 

atg aag ate att ttc gta ttt get etc ctt get att gtt gca tgc aac 48 

Met Lys He He Phe Val Phe Ala Leu Leu Ala He Val Ala Cys Asn 

1 5 10 15 

get tct gca egg ttt gat get ctt agt caa agt tat aga caa tat caa 96 
Ala Ser Ala Arg Phe Asp Ala Leu Ser Gin Ser Tyr Arg Gin Tyr Gin 
20 25 30 

eta caa teg cat etc ctg eta cag caa caa gtg etc age cca tgc agt 144 
Leu Gin Ser His Leu Leu Leu Gin Gin Gin Val Leu Ser Pro Cys Ser 
35 40 45 

gag ttc gta agg caa cag cat age ata gtg gca acc ccc ttc tgg caa 192' 
Glu Phe Val Arg Gin Gin His Ser He Val Ala Thr Pro Phe Trp Gin 
50 55 60 
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cca get acg ttt caa ttg ata aac aac caa gtc atg cag caa cag tgt 240 
Pro Ala Thx Phe Gin Leu lie Asn Asn Gin Val Met Gin Gin Gin Cys 
65 70 75 80 

tgc caa cag etc agg ctg gta gcg caa caa tct cac tac cag gec att 288 
Cys Gin Gin Leu Arg Leu Val Ala Gin Gin Ser His Tyr Gin Ala lie 
85 90 95 

agt age gtt cag gcg att gtg cag caa eta cag ctg cag cag gtc ggt 336 
Ser Ser Val Gin Ala lie Val Gin Gin Leu Gin Leu Gin Gin Val Gly 
100 105 110 

gtt gtc tac ttt gat cag act caa get caa get caa get ttg ctg gee 384 
Val Val Tyr Phe Asp Gin Thr Gin Ala Gin Ala Gin Ala Leu Leu Ala 
115 120 125 

tta aac ttg cca tec ata tgt ggt ate tat cct aac tac tac att get 432 
Leu Asn Leu Pro Ser lie Cys Gly He Tyr Pro Asn Tyr Tyr He Ala 
130 135 140 

ccg agg age att ccc acc gtt ggt ggt gtc tgg tac tga 471 
Pro Arg Ser He Pro Thr Val Gly Gly Val Trp Tyr 
145. 150 155 

<210> 106 
<211> 156 
<212> PRT 

<213> Oryza sativa 
<400> 106 

Met Lys He He Phe Val Phe Ala Leu Leu Ala He Val Ala Cys Asn 
15 10 15 

Ala Ser Ala Arg Phe Asp Ala Leu Ser Gin Ser Tyr Arg Gin Tyr Gin 
20 25 30 

Leu Gin Ser His Leu Leu Leu Gin Gin Gin Val Leu Ser Pro Cys Ser 
35 40 45 

Glu Phe Val Arg Gin Gin His Ser He Val Ala Thr Pro Phe Trp Gin 
50 55 60 

Pro Ala Thr Phe Gin Leu He Asn Asn Gin Val Met Gin Gin Gin Cys 
65 70 75 80 

Cys Gin Gin Leu Arg Leu Val Ala Gin Gin Ser His Tyr Gin Ala He 
85 90 95 

Ser Ser Val Gin Ala He Val Gin Gin Leu Gin Leu Gin Gin Val Gly 
100 105 110 

Val Val Tyr Phe Asp Gin Thr Gin Ala Gin Ala Gin Ala Leu Leu Ala 
115 120 125 

Leu Asn Leu Pro Ser He Cys Gly He Tyr Pro Asn Tyr Tyr He Ala 
130 135 140 

Pro Arg Ser He Pro Thr Val Gly Gly Val Trp Tyr 
145 150 155 



<210> 107 
<211> 645 
<212> DNA 

<213> Avena sativa 



<220> 
<221> CDS 
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<222> (1)..(642) 
<223> avenin 

<400> 107 

atg aag ate ttc ttc ttc tta get etc ctt get ctg gta gtg age gee 48 
Met Lys He Phe Phe Phe Leu Ala Leu Leu Ala Leu Val Val Ser Ala 
1 5 10 15 . 

ace ttt gca caa tat gca gaa tct gac ggt agt tat gag gaa gtg gag 96 
Thr Phe Ala Gin Tyr Ala Glu Ser Asp Gly Ser Tyr Glu Glu Val Glu 
20 25 *30 

ggt tct cat gat cga tgc caa caa cat cag atg aag ctg gac tct tgc 144 
Gly Ser His Asp Arg Cys Gin Gin His Gin Met Lys Leu Asp Ser Cys 
35 40 45 

aga gag tac gtg gcg gag egg tgc aca acg atg aga gat ttt ccg ate 192 
Arg Glu Tyr Val Ala Glu Arg Cys Thr Thr Met Arg Asp Phe Pro He 

50 ' 55 60 

ace tgg cca tgg aaa tgg tgg aag ggt ggt tgc gag gag etc cgc aat 240 
Thr Trp Pro Trp Lys Trp Trp Lys Gly Gly Cys Glu Glu Leu Arg Asri 
65 ~ 70 75 80 

gag tgc tgc caa ctg ttg ggc cag atg cca teg gag tgt cgc tgt gat 288 
Glu Cys Cys Gin Leu Leu Gly Gin Met Pro Ser Glu Cys Arg Cys Asp 
85 90 95 

gcg att tgg aga tea ate cag cgc gag ctt ggt ggc ttc ttt gga act 336 
Ala He Trp Arg Ser He Gin Arg Glu Leu Gly Gly Phe Phe Gly Thr 

. . 100 105 HO 

caa caa ggt ctg ata ggg aaa agg ttg aag at a gee aag agt ttg ccc 384 
Gin Gin Gly Leu He Gly Lys Arg Leu Lys He Ala Lys Ser Leu Pro 

115 120 125 

acg cag tea aca tgg gec ctg agt gca ata tec cca aac tec atg gtt 432 
Thr Gin Ser Thr Trp Ala Leu Ser Ala He Ser Pro Asn Ser Met Val 

130 135 140 

age cac att get gga aag age tec att ctt cgt gee ttg ccc gtg gat 480 
Ser His He Ala Gly Lys Ser Ser He Leu Arg Ala Leu Pro Val Asp 
145 150 155 . 160 

gtc etc gee aat gca tac cgc att tec agg caa gaa gec cga aac etc 528 
Val Leu Ala Asn Ala Tyr Arg He Ser Arg Gin Glu Ala Arg Asn Leu • 
165 170 175 

aaa aac aac agg gga caa gag tct ggt gta ttc act cca aaa ttt ace 576 
Lys Asn Asn Arg Gly Gin Glu Ser Gly Val Phe Thr Pro Lys Phe Thr 
180 185 190 

caa. acg age ttc caa cct tat cca gag ggc gag gat gag tea tct ttg 
Gin Thr Ser Phe Gin Pro Tyr Pro Glu Gly Glu Asp Glu Ser Ser Leu 
195 200 205 

att aat aag gca tea gag taa 
He Asn Lys Ala Ser Glu 
210 

<210> 108 
<211> 214 
.<212> PRT 
<213> Avena sativa 

<400> 108 

Met Lys He Phe Phe Phe Leu Ala Leu Leu Ala Leu Val Val Ser Ala 
15 10 15 



624 



645 
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Thr Phe Ala Gin Tyr Ala Glu Ser Asp Gly Ser Tyr Glu Glu Val Glu 
20 25 30 

Gly Ser His Asp Arg Cys Gin Gin His Gin Met Lys Leu Asp Ser Cys 
35 40 .45 

Arg Glu Tyr Val Ala Glu Arg Cys Thr Thr Met Arg Asp Phe Pro lie 
50 55 60 

Thr Trp Pro Trp Lys Trp Trp Lys Gly Gly Cys Glu Glu Leu Arg Asn 
65 70 75 80 

Glu Cys Cys Gin Leu Leu Gly Gin Met Pro Ser Glu Cys Arg Cys Asp 
85 90 95 

Ala lie Trp Arg Ser lie Gin Arg Glu Leu Gly Gly Phe Phe Gly Thr 
100 105 110 

Gin Gin Gly Leu lie Gly Lys Arg Leu Lys lie Ala Lys Ser Leu Pro 
115 120 125 

Thr Gin Ser Thr Trp Ala Leu Ser Ala lie Ser Pro Asn Ser Met Val 
130 135 140 

Ser His He Ala Gly Lys Ser Ser He Leu Arg Ala Leu Pro Val Asp 
145 150 155 160 

Val Leu Ala Asn Ala Tyr Arg He Ser Arg Gin Glu Ala Arg Asn Leu 
165 170 175 

Lys -Asn Asn Arg Gly Gin Glu Ser Gly Val Phe Thr Pro Lys Phe Thr 
180 185 190 

Gin Thr Ser Phe Gin Pro Tyr Pro Glu Gly Glu Asp Glu Ser Ser Leu 
195 200 205 

He Asn Lys Ala Ser Glu 
210 



<210> 109 
<211> 1044 
<212> DNA 

<213> Hordeum vulgare 

<220> 
<221> CDS 
<222> (1)..(1041) 
<223> c-hordein 

<220> 

<221> misc_feature 
<222> (481) . . (482) 

<223> / trans l_except= (pos:481. . 483 r aa: OTHER) 
<400> 109 

atg aag acg ttc etc acc ttt gtc etc ctt gec atg gcg atg age ate 48 
Met Lys Thr Phe Leu Thr Phe Val Leu Leu Ala Met Ala Met Ser He 
1.5 10 15 

gtc act acc get agg cag eta aac cct age cac caa gag ttg caa tea 96 
Val Thr Thr Ala Arg Gin Leu Asn Pro Ser His Gin Glu Leu Gin Ser 
20 25 30 

cca caa caa cca ttt ctg aaa caa caa tea tat ctg caa caa cca tat 144 
Pro Gin Gin Pro Phe Leu Lys Gin Gin Ser Tyr Leu Gin Gin Pro Tyr 
35 40 45 
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cca caa caa cca tat eta ccg cag caa cca ttc ccc aca ccc caa caa 192 
Pro Gin Gin Pro Tyr Leu Pro Gin Gin Pro Phe Pro Thr Pro. Gin Gin 
50 55 60 

ttt ttc ccc tat eta cca cag caa aca ttt ccc cca tec caa caa cca 240 
Phe Phe Pro Tyr Leu Pro Gin Gin Thr Phe Pro Pro .Ser Gin Gin Pro 
65 70 75 . 80 

aac ccc eta caa cca caa caa cca ttc ccc ctg caa ccc caa cca cca 288 
Asn Pro Leu Gin Pro Gin Gin Pro Phe Pro Leu Gin Pro Gin Pro Pro 
' 85 90 95 

caa caa cct ttt cct cag ccc caa caa cca aat ccc cag caa cca caa 336 
Gin Gin Pro Phe Pro Gin Pro Gin Gin Pro Asn Pro Gin Gin Pro Gin 
100 105 110 

caa cct ttc ccc egg caa cca caa caa ata gta ccc cag caa cca caa 384 
Gin Pro Phe Pro Arg Gin Pro Gin Gin He Val Pro Gin Gin Pro Gin 
115 120 125 

caa cca ttc cct cag caa cca caa caa cct ttt cct cag ccc caa caa 432 
Gin Pro Phe Pro Gin Gin Pro Gin Gin Pro Phe Pro Gin Pro Gin Gin 

130 135 140 

cca ttc tct tgg caa cca caa caa cca ttt etc cag ccc eta caa eta 480 
Pro Phe Ser Trp Gin Pro Gin Gin Pro Phe Leu Gin Pro Leu Gin Leu 
145 150 155 ■ 160 

tag ccc ctg caa gca caa caa cca ttc ccc ttg caa cct caa eta cca 528 

Pro Leu Gin Ala Gin Gin Pro Phe Pro Leu Gin Pro Gin Leu Pro 
165 170 175 

ttt ccg caa ccc caa caa cca att gga cag caa cca aaa caa cca etc 576 
Phe Pro Gin Pro Gin Gin Pro He Gly Gin Gin Pro Lys Gin Pro Leu 
180 185 190 

ctg cag caa cca caa caa aca att ccc cag caa cca caa caa cca ttc 624 
Leu Gin Gin Pro Gin Gin Thr He Pro Gin Gin Pro Gin Gin Pro Phe 
195 200 - 205 

ccc ctg cag ccg caa caa cca ttc ccc caa caa cca caa caa cca ctt 672 
Pro Leu Gin Pro Gin Gin Pro Phe Pro Gin Gin Pro Gin Gin Pro Leu 

210 215 220 

ccc caa caa ccc caa caa ata att tec cag caa* ccc caa caa cca ttc .720 
Pro Gin Gin Pro Gin Gin He He Ser Gin Gin Pro Gin Gin Pro Phe 
225 230 235 240 

cct eta caa cct caa caa cca ttc ccc caa ccc caa cca ttc ccc cag 768 
Pro Leu Gin Pro Gin Gin Pro Phe Pro Gin Pro Gin Pro Phe Pro Gin 
245 250 255 

gag caa ccc caa caa gca ttc ccc eta caa ccg caa caa cca ttc ccc 816 
Glu Gin Pro Gin Gin Ala Phe Pro Leu Gin Pro Gin Gin Pro Phe Pro 
260 265 270 

gag gaa tea gaa caa ata att ace caa caa cca ttc cct eta caa cca 864 

Glu Glu Ser Glu Gin He He Thr Gin Gin Pro Phe Pro Leu Gin Pro 

275 280 285 

caa caa ctg ttc ccc cag caa cca caa caa cca ctt ccc cag ccc caa 912 

Gin Gin Leu Phe Pro Gin Gin Pro Gin Gin Pro Leu Pro Gin Pro Gin 

290 295 300 

caa cca ttc cgc caa eta cca aaa tat ata att ccc cag caa cct caa 960 

Gin Pro Phe Arg Gin Leu Pro Lys Tyr He He Pro Gin Gin Pro Gin 
305 310 315 320 
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' caa cca ttc ctt ctg caa cca cac caa cct cag caa cct tat gca caa 1008 
Gin Pro Phe Leu Leu Gin Pro His Gin Pro Gin Gin Pro Tyr Ala Gin 
325 - 330 335 

caa gac ate tgg agt gat ata gec etc ttg ggc taa 1044 
Gin Asp He Trp Ser Asp He Ala Leu Leu Gly 
340 345 

<210> 110 
<211> 160 
<212> PRT 

<213> Hordeum vulgare 



<400> 110 



Met 


Lys 


Thr 


Phe Leu Thr Phe Val Leu Leu Ala- Met Ala Met 


Ser 


He 


1 




5 10 






15 




Val 


Thr 


Thr 


Ala Arg Gin Leu Asn Pro Ser His Gin Glu Leu Gin Ser 








20 25 




30 






Pro 


Gin 


Gin 


Pro Phe Leu Lys Gin Gin Ser Tyr Leu 


Gin 


Gin 


Pro 


Tyr 






35 


40 


45 








Pro 


Gin 


Gin 


Pro Tyr Leu Pro Gin Gin Pro Phe Pro 


Thr 


Pro 


Gin 


Gin 




50 




55 60 










Phe 


Phe 


Pro- 


Tyr' Leu Pro Gin Gin Thr Phe Pro Pro 


Ser 


Gin 


Gin 


Pro 


65 






70 75" 








80 


Asn 


Pro 


Leu 


Gin Pro Gin Gin Pro Phe Pro Leu Gin 


Pro 


Gin 


Pro 


Pro 








85 90 






95 




Gin 


Gin 


Pro 


Phe Pro Gin Pro Gin Gin Pro Asn Pro 


Gin 


Gin 


Pro 


Gin 








100 105 




110 






Gin 


Pro 


Phe 


Pro Arg Gin Pro Gin Gin He Val Pro 


Gin 


Gin 


Pro 


Gin 






115 


120 


125 








Gin 


Pro 


Phe 


Pro Gin Gin Pro Gin Gin Pro Phe Pro 


Gin 


Pro 


Gin Gin 




13 0 




135 140 










Pro 


Phe 


Ser 


Trp Gin Pro Gin Gin Pro Phe Leu Gin 


Pro 


Leu 


Gin 


Leu 


145 






150 155 








160 



<210> 111 
<211> 186 
<212> PRT 

<213> Hordeum vulgare 
<400> 111 



Pro 


Leu 


Gin 


Ala 


Gin 


Gin 


Pro 


Phe 


Pro Leu Gin Pro Gin 


Leu 


Pro Phe 


- 1 








5 








10 






15 


Pro 


Gin 


Pro 


Gin 


Gin 


Pro He Gly Gin Gin Pro Lys Gin 


Pro 


Leu Leu 








20 










25 




30 




Gin 


Gin 


Pro 


Gin 


Gin 


Thr 


He 


Pro 


Gin Gin Pro Gin Gin 


Pro 


Phe Pro 






35 










40 




45 






Leu 


Gin 


Pro 


Gin 


Gin 


Pro 


Phe 


Pro 


Gin Gin 


Pro Gin Gin 


Pro 


Leu Pro 




50 










55 






60 






Gin 


Gin 


Pro 


Gin 


Gin 


lie 


He 


Ser 


Gin Gin 


Pro Gin Gin 


Pro 


Phe Pro 


65 










70 








75 




80 


Leu 


Gin 


Pro 


Gin 


Gin 


Pro 


Phe 


Pro 


Gin Pro 


Gin Pro Phe 


Pro Gin Glu 










85 








90 






.95 


Gin 


Pro 


Gin 


Gin 


Ala 


Phe 


Pro 


Leu 


Gin Pro 


Gin Gin Pro 


Phe 


Pro Glu 








100 










105 




110 




Glu 


Ser 


Glu 


Gin 


He 


lie 


Thr 


Gin 


Gin Pro 


Phe Pro Leu 


Gin 


Pro Gin 






115 










120 




125 






Gin 


Leu 


Phe 


Pro 


Gin 


Gin 


Pro 


Gin 


Gin Pro 


Leu Pro Gin 


Pro 


Gin Gin 




130 










135 






140 






Pro 


Phe 


Arg 


Gin 


Leu 


Pro 


Lys 


Tyr 


He He 


Pro Gin Gin 


Pro 


Gin Gin 


145 










150 








155 




160 
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96 



144 



114 

Pro Phe Leu Leu Gin Pro His Gin Pro Gin Gin Pro Tyr Ala Gin Gin 

165 170 175 

Asp lie Trp Ser Asp lie Ala Leu Leu Gly 
. 180 185 

<210> 112 
<211> 924 
<212> DNA 

<213> Triticum aestivum 

<220> 

<221> CDS 

<222> (1) . . (921) 

<223> glutenin-lDl 

<400> 112 

atg aag acc ttc etc gtc ttt gec etc etc gee gtt gcg gcg aca agt 48 
Met Lys Thr Phe Leu Val Phe Ala Leu Leu Ala Val Ala Ala Thr Ser 

l' 5 10 15 

gca att gcg cag atg gag act aga tgc ate cct ggt ttg gag aga cca 
Ala lie Ala Gin Met Glu Thr Arg Cys lie Pro Gly Leu Glu Arg Pro 

20 25 30 

tgg cag cag caa cca tta cca cca caa cag aca ttt cca caa caa cca 
Trp Gin Gin Gin Pro Leu Pro Pro Gin Gin Thr Phe Pro Gin Gin Pro 

35 40 45 

eta ttt tea caa caa caa caa caa caa eta ttt cct caa caa cca tea 192 
Leu Phe Ser Gin Gin Gin Gin Gin Gin Leu Phe Pro Gin Gin Pro Ser 

50 55 60 

ttt teg cag caa caa cca cca ttt tgg cag caa caa cca cca ttt tct 
Phe Ser Gin Gin Gin Pro Pro Phe Trp Gin Gin Gin Pro Pro' Phe Ser 
65 70 75 80 

cag caa caa cca att eta cca cag caa cca cca ttt teg cag caa caa 
Gin Gin Gin Pro lie Leu Pro Gin Gin Pro Pro Phe Ser Gin Gin Gin 
85 90 95 

caa eta gtt eta ccg caa caa cca cca ttt tea cag caa caa caa cca 
Gin Leu Val Leu Pro Gin Gin Pro Pro Phe Ser Gin Gin Gin Gin Pro 

100 105 110 

gtt tta cct cca caa caa tea cct ttt cca caa caa caa caa caa cac 
Val Leu Pro Pro Gin Gin Ser Pro Phe Pro' Glh Gin Gin Gin Gin His 

115 120 125 

caa cag ctg gtg caa caa caa ate cct gtt gtt cag cca tec att ttg 432 
Gin Gin Leu Val Gin Gin Gin He Pro Val Val Gin Pro Ser He Leu 

130 135 140 

cag cag eta aac cca tgc aag gta ttc etc cag cag cag tgc age cct 480 
Gin Gin Leu Asn Pro Cys Lys Val Phe Leu Gin Gin Gin Cys Ser Pro 
145 150 155 160 

gtg gca atg cca caa cgt ctt get agg teg caa atg ttg cag cag age 528 
Val Ala Met Pro Gin Arg Leu Ala Arg Ser Gin Met Leu Gin Gin Ser 

165 170 175 

agt tgc cat gtg atg caa caa caa tgt tgc cag cag ttg ccg caa ate 576 
Ser Cys His Val Met Gin Gin Gin Cys Cys Gin Gin Leu Pro Gin He 

180 185 190 

ccc cag caa tec cgc tat gag gca ate cgt get ate ate tac tec ate 624 
Pro Gin Gin Ser Arg Tyr Glu Ala He Arg Ala He He Tyr Ser He 
195 200 205 



240 



288 



336 



384 



WO 03/078629 



PCT/EP03/02735 



672 



720 



768 



816 



864 



912 



115 

ate ctg caa gaa caa caa cag gtt cag ggt tec ate caa tct cag cag 

lie Leu Gin Glu Gin Gin Gin Val Gin Gly Ser lie Gin Ser Gin Gin 

210 215 220 

cag caa ccc caa cag ttg ggc caa tgt gtt tec caa ccc caa cag cag 

Gin Gin Pro Gin Gin Leu Gly Gin Cys Val Ser Gin Pro Gin Gin Gin 
225 230 235 240 

teg cag cag caa etc ggg caa caa cct caa caa caa caa ttg gca cag 
Ser Gin Gin Gin Leu Gly Gin Gin Pro Gin Gin Gin Gin Leu Ala Gin 
245 250 255 

ggt ace ttt ttg cag cca cac cag ata get cag ctt gag gtg atg act 
Gly Thr Phe Leu Gin Pro His Gin He Ala Gin Leu Glu Val Met Thr 
260 .265 270 

tec att gcg etc cgt ate ctg cca acg atg tgc agt gtt aat gtg ccg 
Ser He Ala Leu Arg He Leu Pro Thr Met Cys Ser Val Asn Val Pro 

275 280 285 

ttg tac aga ace ace act agt gtg cca ttc ggc gtt ggc ace gga gtt 
Leu Tyr Arg Thr Thr Thr Ser Val Pro Phe Gly Val Gly Thr Gly Val 
290 295 300 

ggt gee tac tga 924 

Gly Ala Tyr 

305 

<210> 113 
<211> 307 
<212> PRT 

<213> Triticum aestivum 
<400> 113 

Met Lys Thr Phe Leu Val Phe Ala Leu Leu Ala Val Ala Ala Thr Ser 
1 5 10 15 

Ala He Ala Gin Met Glu Thr Arg Cys He Pro Gly Leu Glu Arg Pro 
20 25 30 

Trp Gin Gin Gin Pro Leu Pro Pro Gin Gin Thr Phe Pro Gin Gin Pro 
35 40 45 

Leu Phe Ser Gin Gin Gin Gin Gin Gin Leu Phe Pro Gin Gin Pro Ser 
50 55 60 

Phe Ser Gin Gin Gin Pro Pro Phe Trp Gin Gin Gin Pro Pro Phe Ser 

65 70 75 80 

Gin Gin Gin Pro He Leu Pro Gin Gin Pro Pro Phe Ser Gin Gin Gin 
85 90 95 

Gin Leu Val Leu Pro Gin Gin Pro Pro Phe Ser Gin Gin Gin Gin Pro 
100 105 110 

Val Leu Pro Pro Gin Gin Ser Pro Phe Pro Gin Gin Gin Gin Gin His 

115 120 125 

Gin Gin Leu Val Gin Gin Gin He Pro Val Val Gin Pro Ser He Leu 

130 135 140 

Gin Gin Leu Asn Pro Cys Lys Val Phe Leu Gin Gin Gin Cys Ser Pro 
145 150 155 160 

Val Ala Met Pro Gin Arg Leu Ala Arg Ser Gin Met Leu Gin Gin Ser 
165 170 175 

Ser Cys His Val Met Gin Gin Gin Cys Cys Gin Gin Leu Pro Gin He 
180 185 190 
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Pro Gin Gin Ser Arg Tyr Glu Ala lie Arg Ala He He Tyr Ser He 
195 200 205 

He Leu Gin Glu Gin Gin Gin Val Gin Gly Ser He Gin Ser Gin Gin 

210 215 220 

Gin Gin Pro Gin Gin Leu Gly Gin Cys Val Ser Gin Pro Gin Gin Gin 
225 230 235 240 

Ser Gin Gin Gin Leu Gly Gin Gin Pro Gin Gin Gin Gin Leu Ala Gin 
245 250 255 

Gly Thr Phe Leu Gin Pro His Gin He Ala Gin Leu Glu Val Met Thr 
260 265 270 

Ser He Ala Leu Arg He Leu Pro Thr Met Cys Ser Val Asn Val Pro 

275 280 285 

Leu Tyr Arg Thr Thr Thr Ser Val Pro Phe Gly Val Gly Thr Gly Val 
290 295 300 

Gly Ala Tyr 
305 



<210> 114 
<211> 8482 
<212> DNA 

<213> Kunstliche Seguenz 
<220> 

<223> Beschreibung der kiinstlichen Seguenz: binary 
expression vector 

<400> 114 , , 

ttccatggac atacaaatgg acgaacggat aaaccttttc acgccctttt aaatatccga 60 
ttattctaat aaacgctctt ttctcttagg tttacccgcc aatatatcct gtcaaacact 120 
gatagtttaa actgaaggcg ggaaacgaca atcagatcta gtaggaaaca gctatgacca 180 
tgattacgcc aatcaccact ttgtacaaga aagctgggtc tagatgacgg acaatcagta 240 
aattgaacgg agaatattat tcataaaaat acgatagtaa cgggtgatat attcattaga 300 
atgaaccgaa accggcggta aggatctgag ctacacatgc tcaggttttt tacaacgtgc 3 60 
acaacagaat tgaaagcaaa tatcatgcga tcataggcgt ctcgcatatc tcattaaagc 420 
aggaggcctt ctagactgca ggcggccgcc caccgcggtg ggctggctat gaagaaatta 480 
taatcgtgta aaacttagtg agtgtgtatg aatgaaagta ttgcaaaatc ctcattatat 540 
agactacatg cataactagt tgcatgtaaa tttgtagttt tct teat tat tgcatcctcc 600 
aagtggatgt catggtttta cacatggctt ecatgeaaat catttccaaa atatttttaa 660 
actttccaca gggcatccat gcatgcacct caaaacttgt gtgtggtaac attgttgtct 720 
tgaaaaatta ctaaaccttt tgtccacgtg acgttcatgc acctcaaatc ttgtgtggta 780 
ccattattat cctcaagaat tattgaatgt ttggtgtata tgccatccat geagcattge 840 
aacaattaaa tctccaaacc ttgtggtacc atattcactc actttaattc tcctatagta 900 
gaaatattag caaatattta catttccagt tgattagtat atgtatttag aagacaaaaa 960 
taatttagaa tcaattaatc aacttgeaaa ttgctaagtg ttggcaaacg ttagcataaa 1020 
aggtgttata aatttagtac caaatataaa aatttatege aaatcaaata cataacacac 1080 
atagtaaaac aaaaacaaat tacaagggtt tagaegttta gtggcaatgt gtaaatttgc 1140 
tcgactgaat tggttccttt aagectgett ttttgtacaa acttgtgata attcactggc 1200 
cgtcgtttta caacgactca ggatcctgtc aaacactgat agtttaaact gaaggcggga 1260 
aacgacaatc tgatcatgag eggagaatta agggagtcac gttatgaccc ccgccgatga 1320 
cgcgggacaa geegttttae gtttggaact gacagaaccg caacgttgaa ggagccactc 1380 
agecgegggt ttctggagtt taatgagcta agcacatacg tcagaaacca ttattgcgcg 1440 
ttcaaaagtc gectaaggtc actatcagct agcaaatatt tcttgtcaaa aatgctccac 1500 
tgacgttcca taaattcccc teggtatcca attagagtct catattcact ctcaatccaa 1560 
ataatctgea ccggatctgg ategtttege atgattgaac aagatggatt geaegcaggt 1620 
tctccggccg cttgggtgga gaggctattc ggctatgact gggcacaaca gaeaategge .1680 
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tgctctgatg ccgccgtgtt ccggctgtca 
accgacctgt ccggtgccct gaatgaactg 
gccacgacgg gcgttccttg cgcagctgtg 
tggctgctat tgggcgaagt gccggggcag 
gagaaagtat ccatcatggc tgatgcaatg 
tgcccattcg accaccaagc gaaacatcgc 
ggtcttgtcg atcaggatga tctggacgaa 
ttcgccaggc tcaaggcgcg catgcccgac 
gcctgcttgc cgaatatcat ggtggaaaat 
cggctgggtg tggcggaccg ctatcaggac 
gagcttggcg gcgaatgggc tgaccgcttc 
tcgcagcgca tcgccttcta tcgccttctt 
tagatcttgc tgcgttcgga tattttcgtg 
gatcgttcaa acatttggca ataaagtttc 
atgattatca tataatttct gttgaattac 
atgacgttat ttatgagatg ggtttttatg 
gcgatagaaa acaaaatata gcgcgcaaac 
atgttactag atcgggcctc ctgtcaagct 
tttatgcata gatgcactcg aaatcagcca 
tcagtacatt aaagacgtcc gcaatgtgtt 
accacaatat atcctgccac cagccagcca 
atcaccacgc gttaccacca cgccggccgg 
tgccgagttc gagcgttccc taatcatcga 
ggcccgaggc gtgaagtttg gcccccgccc 
ccgcgagctg atcgaccagg aaggccgcac 
gcatcgctcg accctgtacc gcgcacttga 
caggcggcgc ggtgccttcc gtgaggacgc 
cgagaatgaa cgccaagagg aacaagcatg 
tttttcatta ccgaagagat cgaggcggag 
cccgcgcacg tctcaaccgt gcggctgcat 
ctggcggcct ggccggccag cttggccgct 
tgatgtgtat ttgagtaaaa cagcttgcgt 
gtaaataaac aaatacgcaa ggggaacgca 
gcgggtcagg caagacgacc atcgcaaccc 
ccgatgttct gttagtcgat tccgatcccc 
gggaagatca accgctaacc gttgtcggca 
aggccatcgg ccggcgcgac ttcgtagtga 
ctgtgtccgc gatcaaggca gccgacttcg 
acatatgggc caccgccgac ctggtggagc 
gaaggctaca agcggccttt gtcgtgtcgc 
aggttgccga ggcgctggcc gggtacgagc 
gcgtgagcta cccaggcact gccgccgccg 
gcgacgctgc ccgcgaggtc caggcgctgg 
ttaatgaggt aaagagaaaa tgagcaaaag 
cgcacgcagc agcaaggctg caacgttggc 
ggtcaacttt cagttgccgg cggaggatca 
aggcaagacc attaccgagc tgctatctga 
caaatgaata aatgagtaga tgaattttag 
aacaaccagg caccgacgcc gtggaatgcc 
gcgtaagcgg ctgggttgtc tgccggccct 
aatcggcgtg agcggtcgca aaccatccgg 
tgacctggtg gagaagttga aggccgcgca 
agcacgcccc ggtgaatcgt ggcaagcggc 
accgccggca gccggtgcgc cgtcgattag 
ttttttcgtt ccgatgctct atgacgtggg 
ggccgttttc cgtctgtcga agcgtgaccg 
tccagacggg cacgtagagg tttccgcagg 
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gcgcaggggc gcccggttct ttttgtcaag 1740 
caggacgagg cagcgcggct atcgtggctg 1800 
ctcgacgttg tcactgaagc gggaagggac 1860 
gatctcctgt catctcacct tgctcctgcc 1920 
cggcggctgc atacgcttga tccggctacc 1980 
atcgagcgag cacgtactcg gatggaagcc 2040 
gagcatcagg ggctcgcgcc agccgaactg 2100 
ggcgaggatc tcgtcgtgac ccatggcgat 2160 
ggccgctttt ctggattcat cgactgtggc 2220 
atagcgttgg ctacccgtga tattgctgaa 2280 
ctcgtgcttt acggtatcgc cgctcccgat 2340 
gacgagttct tctgagcggg acccaagctc 2400 
gagttcccgc cacagacccg gatgatcccc 2460 
ttaagattga atcctgttgc cggtcttgcg 2520 
gttaagcatg taataattaa catgtaatgc 2580 
attagagtcc cgcaattata catttaatac 2640 
taggataaat tatcgcgcgc ggtgtcatct 2700 
ctgcttggta ataattgtca ttagattgtt 2760 
attttagaca agtatcaaac ggatgttaat 2820 
attaagttgt ctaagcgtca atttgtttac 2880 
acagctcccc gaccggcagc tcggcacaaa 2940 
ccgcatggtg ttgaccgtgt tcgccggcat 3000 
ccgcacccgg agcgggcgcg aggccgccaa 3060 
taccctcacc ccggcacaga tcgcgcacgc 3120 
cgtgaaagag gcggctgcac tgcttggcgt 3180 
gcgcagcgag gaagtgacgc ccaccgaggc 3240 
attgaccgag gccgacgccc tggcggccgc 3300 
aaaccgcacc aggacggcca ggacgaaccg 3360 
atgatcgcgg ccgggtacgt gttcgagccg 3420 
gaaatcctgg ccggtttgtc tgatgccaag 3480 
gaagaaaccg agcgccgccg tctaaaaagg 3540 
catgcggtcg ctgcgtatat gatgcgatga 3600 
tgaaggttat cgctgtactt aaccagaaag 3660 
atctagcccg cgccctgcaa ctcgccgggg 3720 
agggcagtgc ccgcgattgg gcggccgtgc 3780 
tcgaccgccc gacgattgac cgcgacgtga 3840 
tcgacggagc gccccaggcg gcggacttgg 3900 
tgctgattcc ggtgcagcca agcccttacg 3960 
tggttaagca gcgcattgag gtcacggatg 4020 
gggcgatcaa aggcacgcgc atcggcggtg 4080 
tgcccattct tgagtcccgt atcacgcagc 4140 
gcacaaccgt tcttgaatca gaacccgagg 4200 
ccgctgaaat taaatcaaaa ctcatttgag 4260 
cacaaacacg ctaagtgccg gccgtccgag 4320 
cagcctggca gacacgccag ccatgaagcg 4380 
caccaagctg aagatgtacg cggtacgcca 4440 
atacatcgcg cagctaccag agtaaatgag 4500 
cggctaaagg aggcggcatg gaaaatcaag 4560 
ccatgtgtgg aggaacgggc ggttggccag 4620 
gcaatggcac tggaaccccc aagcccgagg 4680 
cccggtacaa atcggcgcgg cgctgggtga 4740 
ggccgcccag cggcaacgca tcgaggcaga 4800 
cgctgatcga atccgcaaag aatcccggca 4860 
gaagccgccc aagggcgacg agcaaccaga 4920 
cacccgcgat agtcgcagca tcatggacgt 4980 
acgagctggc gaggtgatcc gctacgagct 5040 
gccggccggc atggccagtg tgtgggatta 5100 
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cgacctggta ctgatggcgg tttcccatct aaccgaatcc atgaaccgat accgggaagg 5160 
gaagggagac aagcccggcc gcgtgttccg tccacacgtt gcggacgtac tcaagttctg 5220 
ccggcgagcc gatggcggaa agcagaaaga cgacctggta gaaacctgca ttcggttaaa 5280 
caccacgcac gttgccatgc agcgtacgaa gaaggccaag aacggccgcc tggtgacggt 5340 
atccgagggt gaagccttga ttagccgcta caagatcgta aagagcgaaa ccgggcggcc 5400 
ggagtacatc gagatcgagc tagctgattg gatgtaccgc gagatcacag aaggcaagaa 5460 
cccggacgtg ctgacggttc accccgatta ctttttgatc gatcccggca tcggccgttt 5520 
tctctaccgc ctggcacgcc gcgccgcagg caaggcagaa gccagatggt tgttcaagac 5580 
gatctacgaa cgcagtggca gcgccggaga gttcaagaag ttctgtttca ccgtgcgcaa 5640 
gctgatcggg tcaaatgacc tgccggagta cgatttgaag gaggaggcgg ggcaggctgg 5700 
cccgatccta gtcatgcgct accgcaacct gatcgagggc gaagcatccg ccggttccta 5760 
atgtacggag cagatgctag ggcaaattgc cctagcaggg gaaaaaggtc gaaaaggtct 5820 
ctttcctgtg gatagcacgf acattgggaa cccaaagccg tacattggga accggaaccc 5880 
gtacattggg aacccaaagc cgtacattgg gaaccggtca cacatgtaag tgactgatat 5940 
aaaagagaaa aaaggcgatt tttccgccta aaactcttta aaacttatta aaactcttaa 6000 
aacccgcctg gcctgtgcat aactgtctgg ccagcgcaca gccgaagagc tgcaaaaagc 6060 
gcctaccctt cggtcgctgc gctccctacg ccccgccgct tcgcgtcggc ctatcgcggc 6120 
cgctggccgc tcaaaaatgg ctggcctacg gccaggcaat ctaccagggc gcggacaagc 6180 
cgcgccgtcg ccactcgacc gccggcgccc acatcaaggc ■ accctgcctc gcgcgtttcg 6240 
gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca gcttgtctgt 6300 
aagcggatgc egggagcaga caagcccgtc agggcgcgtc agcgggtgtt ggcgggtgtc 6360 
ggggcgcagc catgacccag tcacgtagcg atagcggagt gtatactggc t-taactatgc 6420 
ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac cgcacagatg 6480 
cgtaaggaga aaataccgca tcaggcgctc ttccgcttcc tcgctcactg actcgctgcg 6540 
ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc 6600 
cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag 6660 
gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca 6720 
tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca 6780 
ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg 6840 
atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag 6900 
gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt 6960 
tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca 7020 
cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg 7080 
cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt 7140 
tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc 7200 
cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg 7260 
cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg 7320 
gaacgaaaac tcacgttaag ggattttggt catgcatgat atatctccca atttgtgtag 7380 
ggcttattat gcacgcttaa aaataataaa agcagacttg acctgatagt ttggctgtga 7440 
gcaattatgt gcttagtgca tctaacgctt gagttaagcc gcgccgcgaa gcggcgtcgg 7500 
•cttgaacgaa tttctagcta gacattattt gccgactacc ttggtgatct cgcctttcac 7560 
gtagtggaca aattcttcca actgatctgc gcgcgaggcc aagcgatctt cttcttgtcc 7620 
aagataagcc tgtctagctt caagtatgac gggctgatac tgggccggca ggcgctccat 7680 
tgcccagtcg gcagcgacat ccttcggcgc gattttgccg gttactgcgc tgtaccaaat 7740 
gcgggacaac gtaagcacta catttcgctc atcgccagcc cagtcgggcg gcgagttcca 7800 
tagcgttaag gtttcattta gcgcctcaaa tagatcctgt tcaggaaccg gatcaaagag 7860 
ttcctccgcc gctggaccta ccaaggcaac gctatgttct cttgcttttg tcagcaagat 7920 
agccagatca atgtcgatcg tggctggctc gaagatacct gcaagaatgt cattgcgctg 7980 
ccattctcca aattgcagtt cgcgcttagc tggataacgc cacggaatga tgtcgtcgtg 8040 
cacaacaatg gtgacttcta cagcgcggag aatctcgctc tctccagggg aagccgaagt 8100 
ttccaaaagg tcgttgatca aagctcgccg cgttgtttca tcaagcctta cggtcaccgt 8160 
aaccagcaaa tcaatatcac tgtgtggctt caggccgcca tccactgcgg agccgtacaa 8220 
atgtacggcc agcaacgtcg gttcgagatg gcgctcgatg acgccaacta cctctgatag 8280 
ttgagtcgat acttcggcga tcaccgcttc ccccatgatg tttaactttg ttttagggcg 8340 
actgccctgc tgcgtaacat cgttgctgct ccataacatc aaacatcgac ccacggcgta 8400 
acgcgcttgc tgcttggatg cccgaggcat agactgtacc ccaaaaaaac agtcataaca 8460 
agccatgaaa accgccactg eg 8482 
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<210> 115 
<211> 575 
<212> DNA 

<213> Brassica napus 
<220> 

<221> misc_feature 

<222> (1) . . (6) 

<223> restriction site 

<220> 

<221> misc_feature 
<222> (570) . . (575) 
<223> restriction site 

<220> 

<221> mis cofeature 
<222> (7) . . (575) 

<223> coding for homogentisate-1, 2-di oxygenase (HDG) 
<400> 115 

gtcgacgggc cgatgggggc gaagggtctt gctgcaccaa gagattttct tgcaccaacg 60 
gcatggtttg aggaagggct acggcctgac tacactattg ttcagaagtt tggcggtgaa 120 
ctctttactg ctaaacaaga tttctctccg ttcaatgtgg ttgcctggca tggcaattac 180 
gtgccttata agtatgacct gcacaagttc tgtccataca acactgtcct tgtagaccat 240 
ggagatccat ctgtaaatac agttctgaca gcaccaacgg ataaacctgg tgtggccttg 300 
cttgattttg tcatattccc tcctcgttgg ttggttgctg agcatacctt tcgacctcct 3 60 
tactaccatc gtaactgcat gagtgaattt atgggcctaa tctatggtgc ttacgaggcc 420 
aaagctgatg gatttctacc tggtggcgca agtcttcaca gttgtatgac acctcatggt 480 
ccagatacaa ccacatacga ggcgacgatt gctcgtgtaa atgcaatggc tccttataag 540 
ctcacaggca ccatggcctt catgtttgag gtacc 575 

<210> 116 
<211> 1386 
<212> DNA 

<213> Arabidopsis thaliana 

<220> 

<221> CDS 

<222> (1) . . (1383) 

<223> coding for homogentisate-1, 2 -dioxygenase (HDG) 
<400> 116 

atg gaa gag aag aag aag gag ctt gaa gag ttg aag-t'^t caa' tea ggt 48 
Met Glu Glu Lys Lys Lys Glu Leu Glu Glu Leu Lys Tyr Gin Ser Gly 
15 10 15 

ttt ggt aac cac ttc tea teg gaa gca ate gee gga get tta ccg tta 96 
Phe Gly Asn His Phe Ser Ser Glu Ala lie Ala Gly Ala Leu Pro Leu 
20 25 30 

gat cag aac agt cct ctt ctt tgt cct tac ggt ctt tac gec gaa cag 144 
Asp Gin Asn Ser Pro Leu Leu Cys Pro Tyr Gly Leu Tyr Ala Glu Gin 

35 40 45 

ate tec ggt act tct ttc act tct cct cgc aag etc aat caa aga agt 192 
lie Ser Gly Thr Ser Phe Thr Ser Pro Arg Lys Leu Asn Gin Arg Ser 

50 " 55 60 

tgg ttg tac egg gtt aaa cca teg gtt aca cat gaa ccg ttc aag cct 240 
Trp Leu Tyr Arg Val Lys Pro Ser Val Thr His Glu Pro Phe Lys Pro 
65 70 75 80 

cgt gta cca get cat aag aag ctt gtg agt gag ttt gat gca tea aat 2 88 
Arg Val Pro Ala His Lys Lys Leu Val Ser Glu Phe Asp Ala Ser Asn 
85 90 95 



480 



528 
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agt cgt acg aat ccg act cag ctt egg tgg aga cct gag gat att cct 33 6 
Ser Arg Thr Asn Pro Thr Gin Leu Arg Trp Arg Pro Glu Asp lie Pro 

100 105 110 

gat teg gag att gat ttc gtt gat ggg tta ttt acc att tgt gga get 384 
Asp Ser Glu He Asp Phe Val Asp Gly Leu Phe Thr He Cys Gly Ala 

115 120 125 

gga age teg ttt ctt cgc cat ggc ttc get att cac atg tat gtg get 432 
Gly Ser Ser Phe Leu Arg His Gly Phe Ala He His Met Tyr Val Ala 

130 135 140 

aac aca gga atg aaa gac tec gca ttt tgc aac get gat ggt gac ttc 
Asn Thr Gly Met Lys Asp Ser Ala Phe Cys Asn Ala Asp Gly Asp Phe 
145 150 155 160 

ttg tta gtt cct caa aca gga agg eta tgg att gaa act gag tgt gga 
Leu Leu Val Pro Gin Thr Gly Arg Leu Tzp He Glu Thr Glu Cys Gly 
165 170 175 

agg ctt ttg gta act cct ggt gag att get gtt ata cca caa ggt ttc 576 
Arg Leu Leu Val Thr Pro Gly Glu He Ala Val He Pro Gin Gly Phe 
18.0 185 . 190 

cgt ttc tec ata gat tta ccg gat ggg aag tct cgt ggt tat gtt get 624 
Arg Phe Ser He Asp Leu Pro Asp Gly Lys Ser Arg Gly Tyr Val Ala 
195 200 205 

gaa ate tat ggg get cat ttt cag ctt cct gat ctt gga cca ata ggt 672 

Glu He Tyr Gly Ala His Phe Gin Leu Pro Asp Leu Gly Pro He Gly 

210 215 220 

get aat ggt ctt get gca tea aga gat ttt ctt gca cca aca gca tgg 720 

Ala Asn Gly Leu Ala Ala Ser Arg Asp Phe Leu Ala Pro Thr Ala Trp 
225 230 235 240 

ttt gag gat gga ttg egg cct gaa tac aca att gtt cag aag ttt ggc 768 

Phe Glu Asp Gly Leu Arg Pro Glu Tyr Thr He Val Gin Lys Phe Gly 
245 250 255 

ggt gaa etc ttt act get aaa caa gat ttc tct cca ttc aat gtg gtt 
Gly Glu Leu Phe Thr Ala Lys Gin Asp Phe Ser Pro Phe Asn Val Val 
260 265 270 

gec tgg cat ggc aat tac gtg cct tat aag tat gac ctg aag aag ttc 
Ala Trp His Gly Asn Tyr Val Pro Tyr Lys Tyr Asp Leu Lys Lys Phe 

275 280 285 

tgt cca tac aac act gtg ctt tta gat cat gga gat cca tct ata aat 
Cys Pro Tyr Asn Thr Val Leu Leu Asp His Gly Asp Pro Ser He Asn 

290 295 300 

aca gtc ctt aca gca cca act gat aaa cct ggt gtg gec ttg ctt gat 
Thr Val Leu Thr Ala Pro Thr Asp Lys Pro Gly Val Ala Leu Leu Asp 
305. 310 315 320 

ttt gtc ata ttt cct cct cga tgg ttg gtt get gag cat act ttt cga 
Phe Val He Phe Pro Pro Arg Trp Leu Val Ala Glu His Thr Phe Arg 
325 330 335 

cct cct tac tat cat cgt aac tgc atg agt gaa ttt atg ggc tta ate 
Pro Pro Tyr Tyr His Arg Asn Cys Met Ser Glu Phe Met Gly Leu He 
340 345 350 

tac ggt gca tac gag gcg aaa get gat gga ttt etc cct ggc ggt gca 1104 
Tyr Gly Ala Tyr Glu Ala Lys Ala Asp Gly Phe Leu Pro Gly Gly Ala 
355 360 365 



816 



864 



912 



960 



1008 



1056 
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agt ctt cat age tgt atg aca cct cat ggt cca gat act acc acg tac 1152 
Ser Leu His Ser Cys Met Thr Pro His Gly Pro Asp Thr Thr Thr Tyr 
370 375 380 

gag gcg aca att get cga gta aat gca atg get cct tct aaa etc aca 1200 
Glu Ala Thr lie Ala Arg Val Asn Ala Met Ala Pro Ser Lys Leu Thr 
385 390 . 395 400 

ggt acg atg get ttc atg ttc gaa tea gca ttg ate cct aga gtc tgt 1248 
Gly Thr Met Ala Phe Met Phe Glu Ser Ala Leu lie Pro Arg Val Cys 
405 410 415 

cat tgg get ctg gag tct cct ttc ctg gat cac gac tac tac cag tgt 1296 
His Trp Ala Leu Glu Ser Pro Phe Leu Asp His Asp Tyr Tyr Gin Cys 
420 '425 430 

tgg att ggc etc aag tct cat ttc teg cgc ata age ttg gac aag aca 1344 
Trp lie Gly Leu Lys Ser His Phe Ser Arg lie Ser Leu Asp Lys Thr 
435 440 445 

aat gtt gaa tea aca gag aaa gaa cca gga get teg gag taa 1386 
Asn Val Glu Ser Thr Glu Lys Glu Pro" Gly Ala Ser Glu 
450 455' 460 

<210> 117 
<211> 461 
<212> PRT 

<213> Arabidopsis thaliana 
<400> 117 

Met Glu Glu Lys Lys Lys Glu Leu Glu Glu Leu Lys Tyr Gin Ser Gly 
15 10 15 

Phe Gly Asn His Phe Ser Ser Glu Ala He Ala Gly Ala Leu Pro Leu 
20 25 30 

Asp Gin Asn Ser Pro Leu Leu Cys Pro Tyr Gly Leu Tyr Ala Glu Gin 
35 40 45 

He Ser Gly Thr Ser Phe Thr Ser Pro Arg Lys Leu Asn Gin Arg Ser 
50 55 60 

Trp Leu Tyr Arg Val Lys Pro Ser Val Thr His Glu Pro Phe Lys Pro 
65 70 75 80 

Arg Val Pro Ala His Lys Lys Leu Val Ser Glu Phe Asp Ala Ser Asn 
85 90 95 

Ser Arg Thr Asn Pro Thr Gin Leu Arg Trp Arg Pro Glu Asp He Pro 
100 105 110 

Asp Ser Glu He Asp Phe Val Asp Gly Leu Phe Thr He Cys Gly Ala 
115 120 4 125 

Gly Ser Ser Phe Leu Arg His Gly Phe Ala He His Met Tyr Val Ala 
130 135 140 

Asn Thr Gly Met Lys Asp Ser Ala Phe Cys Asn Ala Asp Gly Asp Phe 
145 150 155 160 

Leu Leu Val Pro Gin Thr Gly Arg Leu Trp He Glu Thr Glu Cys Gly 
165 170 175 

Arg Leu Leu Val Thr Pro Gly Glu He Ala Val He Pro Gin Gly Phe 
180 185 190 

Arg Phe Ser He Asp Leu Pro Asp Gly Lys Ser Arg Gly Tyr Val Ala 
195 200 205 
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Glu lie Tyr Gly Ala His Phe Gin Leu Pro Asp Leu Gly Pro He Gly 
210 215 220 

Ala Asn Gly Leu Ala Ala Ser Arg Asp Phe Leu Ala Pro Thr Ala Trp 
225 " 230 235 240 

Phe Glu Asp Gly Leu Arg Pro Glu Tyr Thr He Val Gin Lys Phe Gly 
245 250 255 

Gly Glu Leu Phe Thr Ala Lys Gin Asp Phe Ser Pro Phe Asn Val Val 
260 265 270 

Ala Trp His Gly Asn Tyr Val Pro Tyr Lys Tyr Asp Leu Lys Lys Phe 
275 280 285 

Cys Pro Tyr Asn Thr Val Leu Leu Asp His Gly Asp Pro Ser He Asn 
290 295 300 

Thr Val Leu Thr Ala Pro Thr Asp Lys Pro Gly Val Ala Leu Leu Asp 
305 310 315 320 

Phe Val He Phe Pro Pro Arg Trp Leu Val Ala Glu His Thr Phe Arg 
325 330 335 

Pro Pro Tyr Tyr His Arg. Asn Cys Met Ser Glu Phe Met Gly Leu He 
340 345 350 

Tyr Gly Ala Tyr Glu Ala Lys Ala Asp Gly Phe Leu Pro Gly Gly Ala 
355 360 365 

Ser Leu His Ser Cys Met Thr Pro His Gly Pro Asp Thr Thr Thr Tyr 
370 375 380 

Glu Ala Thr He Ala Arg Val Asn Ala Met Ala Pro Ser Lys Leu Thr 
385 390 395 400 

Gly Thr Met Ala Phe Met Phe Glu Ser Ala Leu He Pro Arg Val Cys 
405 410 415 

His Trp Ala Leu Glu Ser Pro Phe Leu Asp His Asp Tyr Tyr Gin Cys 
420 425 430 

Trp He Gly Leu Lys Ser His Phe Ser Arg He Ser Leu Asp Lys Thr 
- 435 440 445 

Asn Val Glu Ser Thr Glu Lys Glu Pro Gly Ala Ser Glu 
450 455 460 



<210> 118 
<211> 815 
<212> DNA 

<213> Arabidopsis thaliana 

<220> 

<221> CDS 

<222> (37).. (705) 

<223> coding for inaleylacetoacetate isomerase (MAAI) 
<400> 118 

gtaatctccg aagaagaaca aattccttgc tgaatc atg tct tat gtt acc.gat 54 

Met Ser Tyr Val Thr Asp 
1 5 



ttt tat cag gcg aag ttg aag etc tac tct tac tgg aga age tea tgt 102 
Phe Tyr Gin Ala Lys Leu Lys Leu Tyr Ser Tyr Trp Arg Ser Ser Cys 
10 15 20 
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get cat cgc gtc cgt ate gec etc act tta aaa ggg ctt gat tat gaa 150 
Ala His Arg Val Arg He Ala Leu Thr Leu Lys Gly Leu Asp Tyr Glu 
25 30 35 

tat ata ccg gtt aat ttg etc aaa ggg gat caa tec gat tea gat ttc 198 
Tyr He Pro Val Asn Leu Leu Lys Gly Asp Gin Ser Asp Ser Asp Phe 
40 45 50 

aag aag ate aat cca atg ggc act gta cca gcg ctt gtt gat ggt gat 246 
Lys Lys He Asn Pro Met Gly Thr Val Pro Ala Leu Val Asp Gly Asp 
55 60 65 70 

gtt gtg att aat gac tct ttc gca ata ata atg tac ctg gat gat aag 294 
Val Val He Asn Asp Ser Phe Ala He He Met Tyr Leu Asp Asp Lys 
75 80 85 

tat ccg gag cca ccg ctg tta cca agt gac tac cat aaa egg gcg gta 342 
Tyr Pro Glu Pro Pro Leu Leu Pro Ser Asp Tyr His Lys Arg Ala Val 
90 95 100 

aat tac cag gcg acg agt att gtc atg tct ggt ata cag cct cat caa 390 
Asn Tyr Gin Ala Thr Ser He Val Met Ser Gly He Gin Pro His Gin 

105 HO H5 

aat atg get ctt ttt agg tat etc gag gac aag ata aat get gag gag 
Asn Met Ala Leu Phe Arg Tyr Leu Glu Asp Lys He Asn Ala Glu Glu 
120 125 130 

aaa act get tgg att act aat get ate aca aaa gga ttc aca get etc 
Lys Thr Ala Trp He Thr Asn Ala He Thr Lys Gly Phe Thr Ala Leu 
135 * 140 145 150 

gag aaa ctg ttg gtg agt tgc get gga aaa tac gcg act ggt gat gaa 534 
Glu Lys Leu Leu Val Ser Cys Ala Gly Lys Tyr Ala Thr Gly Asp Glu 
155 160 165 

gtt tac ttg get gat ctt ttc eta gca cca cag ate cac gca gca ttc 
Val Tyr Leu Ala Asp Leu Phe Leu Ala Pro Gin He His Ala Ala Phe 
170 175 180 



438 



486 



582 



aac aga ttc cat att aac atg gaa cca ttc ccg act ctt gca agg ttt 630 
Asn Arg Phe His He Asn Met Glu Pro Phe Pro Thr Leu Ala Arg Phe 
185 190 195 

tac gag tea tac aac gaa ctg -cct gca ttt caa aat gca gtc ccg gag 678 
Tyr Glu Ser Tyr Asn Glu Leu Pro .Ala Phe Gin Asn Ala Val -Pro Glu 

200 205 . 210 

aag caa cca gat act cct tec ace ate tgattctgtg aacegtaage 725 
Lys Gin Pro Asp Thr Pro Ser Thr He 
215 220 

ttctctcagt ctcagctcaa taaaatctct taggaaacaa caacaacacc ttgaacttaa 785 

atgtatcata tgaaccagtt tacaaataat 815 

<210> 119 
<211> 223 
<212> PRT 

<213> Arabidopsis thaliana 
<400> 119 

Met Ser Tyr Val Thr Asp Phe Tyr Gin Ala Lys Leu Lys Leu Tyr Ser 
1 5 10 15 

Tyr Trp Arg Ser Ser Cys Ala His Arg Val Arg He Ala Leu Thr Leu 
20 25 30 
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Lys Gly Leu Asp Tyr Glu Tyr lie Pro Val Asn Leu Leu Lys Gly Asp 
35 40 45 

Gin Ser Asp Ser Asp Phe Lys Lys He Asn Pro Met Gly Thr Val Pro 
50 55 60 

Ala Leu Val Asp Gly Asp Val Val He Asn Asp Ser Phe Ala He He 
65- 70 75 80 

Met Tyr Leu Asp Asp Lys Tyr Pro Glu Pro Pro Leu Leu Pro Ser Asp 
85 90 95 

Tyr His Lys Arg Ala Val Asn Tyr Gin Ala Thr Ser He Val Met Ser 
100 105 HO 

Gly He Gin Pro His Gin Asn Met Ala Leu Phe Arg Tyr Leu Glu Asp 
115 120 125 

Lys He Asn Ala Glu Glu Lys Thr Ala Trp He Thr Asn Ala He Thr 
130 135 140 

Lys Gly Phe Thr Ala Leu Glu Lys Leu Leu Val Ser Cys Ala Gly Lys 
145 150 155 160 

Tyr Ala Thr Gly Asp Glu Val Tyr Leu Ala Asp Leu Phe Leu Ala Pro 
165 170 175 

Gin He His Ala Ala Phe Asn Arg Phe His He Asn Met Glu Pro Phe 
180 185 190 

Pro Thr Leu Ala Arg Phe Tyr Glu Ser Tyr Asn Glu Leu Pro Ala Phe 
195 200 205 

Gin Asn Ala Val Pro Glu Lys Gin Pro Asp Thr Pro Ser Thr He 
210 215 220 



<210> 120 
<211> 1227 
<212> DNA 

<213> Arabidopsis thaliana 

<220> • 

<221> CDS 

<222> (1) . . (1224) 

<223> coding for fumarylacetoacetate hydrolase (FAAH) 



atg 
Met 
1 


gcg 
Ala 


ttg 
Leu 


ctg 
Leu 


aag 
Lys 
5 


tct 
Ser 


ttc 
Phe 


ate 
He 


gat gtt 
Asp Val 
10 


ggc 

Gly 


tea 
Ser 


gac 
Asp 


teg cac ttc 
Ser His Phe 
15 


48 


cct 
Pro 


ate 
He 


cag 
Gin 


aat 
Asn 
20 


etc 
Leu 


cct 
Pro 


tat 
Tyr 


ggt 

Gly 


gtc ttc 
Val Phe 
25 


aaa 
Lys 


ccg 
Pro 


gaa 
Glu 


teg aac tea 
Ser Asn Ser 
30 


96 


act 
Thr 


cct 
Pro 


cgt 
Arg 
35 


cct 
Pro 


gee 
Ala 


gtc 
Val 


get 
Ala 


ate 
He 
40 


ggc gat 
Gly Asp 


ttg 
Leu 


gtt 

Val 


ctg 
Leu 
45 


gac etc tec 
Asp Leu Ser 


144 


get 
Ala 


ate 
He 
50 


tct 
Ser 


gaa 
Glu 


get 
Ala 


ggg 
Gly 


ctt 
Leu 
55 


ttc 
Phe 


gat ggt 
Asp Gly 


ctg 
Leu 


ate 
He 
60 


ctt 
Leu 


aag gac gca 
Lys Asp Ala 


192 


gat 
Asp 
65 


tgc 
Cys 


ttt 
Phe 


ctt 
Leu 


cag 
Gin 


cct 
Pro 
70 


aat 
Asn 


ttg 
Leu 


aat aag 
Asn Lys 


ttc 
Phe 
75 


ttg 
Leu 


gee 
Ala 


atg gga egg 
Met Gly Arg 
80 


240 
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cct gcg tgg aag gaa gcg cgt tct acg ctg caa aga ate ttg tea ttt 288 
Pro Ala Trp Lys Glu Ala Arg Ser Thr Leu Gin Arg He Leu Ser Phe 
85 90 95 

ttg tta ttt ggc ttc aag gtt ttg gtt ttg gta tgt ttt cat gca get 336 
Leu Leu Phe Gly Phe Lys Val Leu Val Leu Val Cys Phe His Ala Ala 

100 105 HO 

aat gaa cct ate ttg cga gac aat gat gtt ttg agg aga aaa tea ttc 3 84 
Asn Glu Pro He Leu Arg Asp Asn Asp Val Leu Arg Arg Lys Ser Phe 

115 120 125 

cat cag atg agt aaa gtg gaa atg att gtt cct atg gtg att ggg gac 432 
His Gin Met Ser Lys Val Glu Met He Val Pro Met Val He Gly Asp 

130 135 140 

tat aca gac ttc ttt gca tct atg cat cac gcg aag aac tgc gga ctt 480 
Tyr Thr Asp Phe Phe Ala Ser Met His His Ala Lys Asn Cys Gly Leu 
145 150 155 160 

atg ttc cgt ggg cct gag aat gcg ata aac cca aat tgg ttt cgt ctt 528 
Met Phe Arg Gly Pro Glu Asri Ala He Asn' Pro Asn .Trp Phe Arg Leu 
165 170 175 

ccc att gca tat cat gga egg gca tea tct att gtc ate tct ggg act 576 
Pro He Ala Tyr His Gly Arg Ala Ser Ser He Val He Ser Gly Thr 
180 185 190 

gac att att cga cca aga ggt cag ggc cat cca caa gga aac tct gaa 624 
Asp He He Arg Pro Arg Gly Gin Gly His Pro Gin Gly Asn Ser Glu 
195 " 200 205 

cca tat ttt gga cct teg aag aaa ctt gat ttt gag ctt gag atg get 672 
Pro Tyr Phe Gly Pro Ser Lys Lys Leu Asp Phe Glu Leu Glu Met Ala 

210 215 220 

get gtg gtt ggt cca gga aat gaa ttg gga aag cct att gac gtg aat 720 
Ala Val Val Gly Pro Gly Asn Glu Leu Gly Lys Pro He Asp Val Asn 
225 230 235 240 

aat gca gee gat cat ata ttt ggt eta tta ctg atg aat gac tgg agt 
Asn Ala Ala Asp His He Phe Gly Leu Leu Leu Met Asn Asp Trp Ser 
. " 245 250 255 

get agg gat att cag gcg tgg gag tat gta cct ctt ggt cct ttc ctg 816 
Ala Arg Asp He Gin Ala Trp Glu Tyr Val Pro Leu Gly Pro Phe Leu 
260 265 270 

ggg aag agt ttt ggg act act ata tec cct tgg att gtt acc ttg gat 864 
Gly Lys Ser Phe Gly Thr Thr He Ser Pro Trp He Val Thr Leu Asp 

275 280 285 

gcg ctt gag cct ttt ggt tgt caa get ccc aag cag gat cca cct cca 912 
Ala Leu Glu Pro Phe Gly Cys Gin Ala Pro Lys Gin Asp Pro Pro Pro 

290 295 300 

ttg cca tat ttg get gag aaa gag tct gta aat tac gat ate tec ttg 
Leu Pro Tyr Leu Ala Glu Lys Glu Ser Val Asn Tyr Asp He Ser Leu 
305 310 315 320 



gag eta gca cac cat acc gtt aac ggt tgc aat ttg agg cct ggt gat 
Glu Leu Ala His His Thr Val Asn Gly Cys Asn Leu Arg Pro Gly Asp 
325 330 335 

etc ctt ggc aca gga acc ata age gga ccg gag cca gat tea tat ggg 
Leu Leu Gly Thr Gly Thr He Ser Gly Pro Glu Pro Asp Ser Tyr Gly 
340 345 350 



768 



960 



1008 



1056 
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tgc eta ctt gag ttg aca tgg aat gga cag aaa cct eta tea etc aat 1104 

Cys Leu Leu Glu Leu Thr Trp Asn Gly Gin Lys Pro Leu Ser Leu Asn 
355 360 365 

gga aca act cag acg ttt etc gaa gac gga gac caa gtc ace ttc tea 1152 
Gly Thr Thr Gin Thr Phe Leu Glu Asp Gly Asp Gin Val Thr Phe Ser 
370 375 380 

ggt gta tgc aag gga gat ggt tac aat gtt ggg ttt gga aca tgc aca 1200 
Gly Val Cys Lys Gly Asp Gly Tyr Asn Val Gly Phe Gly Thr Cys Thr 
385 390 395 400 

ggg aaa att gtt cct tea ccg cct tga 1227 
Gly Lys lie Val Pro Ser Pro Pro 
405 

<210> 121 
<211> 408 
<212> PRT 

<213> Arabidppsis thaliana 
<400> 121 

Met Ala Leu Leu Lys Ser Phe lie Asp Val Gly S.er Asp. Ser His Phe 
• 1 5 10 15 * 

Pro He Gin Asn Leu Pro Tyr Gly Val Phe Lys Pro Glu Ser Asn Ser 
20 25 30 

Thr Pro Arg Pro Ala Val Ala He Gly Asp Leu Val Leu Asp Leu Ser 
35 40 45 

Ala He Ser Glu Ala Gly Leu Phe Asp Gly Leu He Leu Lys Asp Ala 
50 55 60 

Asp Cys Phe Leu Gin Pro Asn Leu Asn Lys Phe Leu Ala Met Gly Arg 
65 70 75 80 

Pro Ala Trp Lys Glu Ala Arg Ser Thr Leu Gin Arg He Leu Ser Phe 
85 90 95 

Leu Leu Phe Gly Phe Lys Val Leu Val Leu Val Cys Phe His Ala Ala 
100 105 110 

Asn Glu Pro He Leu Arg Asp Asn Asp Val Leu Arg Arg Lys Ser Phe 
115 120 125 

His Gin Met Ser Lys Val Glu Met He Val Pro Met Val He Gly Asp 
130 135 140 

Tyr Thr Asp Phe Phe Ala Ser Met His His Ala Lys Asn Cys Gly Leu 
145 150 155 160 

Met Phe Arg Gly Pro Glu Asn Ala He Asn Pro Asn Trp Phe Arg Leu 
165 170 175 

Pro He Ala Tyr His Gly Arg Ala Ser Ser He Val He Ser Gly Thr 
180 185 ' 190 

Asp He He Arg Pro Arg Gly Gin Gly His Pro Gin Gly Asn Ser Glu 
195 200 205 

Pro Tyr Phe Gly Pro Ser Lys Lys Leu Asp Phe Glu Leu Glu Met Ala 
210 215 220 

Ala Val Val Gly Pro Gly Asn Glu Leu Gly Lys Pro He Asp Val Asn 
225 230 235 240 

Asn. Ala Ala Asp His He Phe Gly Leu Leu Leu Met Asn Asp Trp Ser 
245 250 255 
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Ala Arg Asp lie Gin Ala Trp Glu Tyr Val Pro Leu Gly Pro Phe Leu 
260 265 270 

Gly Lys Ser Phe Gly Thr Thr lie Ser Pro Trp lie Val Thr Leu Asp 
275 280 285 

Ala Leu Glu Pro Phe Gly Cys Gin Ala Pro Lys Gin Asp Pro Pro- Pro 
290 295 300 

Leu Pro Tyr Leu Ala Glu Lys Glu Ser Val Asn Tyr Asp He Ser Leu 
305 310 315 320 

Glu Leu Ala His His Thr Val Asn Gly Cys Asn Leu Arg Pro Gly Asp 
325 330 335 

Leu Leu Gly Thr Gly Thr He Ser Gly Pro Glu Pro Asp Ser Tyr Gly 
340 345 350 

Cys Leu Leu Glu Leu Thr Trp Asn Gly Gin Lys Pro Leu Ser Leu Asn 
355 360 365 

Gly Thr Thr Gin Thr Phe Leu Glu Asp Gly Asp Gin Val Thr Phe Ser 
370 375 380 

Gly Val Cys Lys Gly Asp Gly Tyr Asn Val Gly Phe Gly Thr Cys Thr 
385 390 395 400 

Gly Lys He Val Pro Ser Pro Pro 
405 



<210> 122 
<211> 11667 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: supression 
construct 2 p3300 . l-Tocl59-GFP-RNAi 

<400> 122 

aattcgtttc tccataataa tgtgtgagta gttcccagat aagggaatta gggttcctat 60 

agggtttcgc tcatgtgttg agcatataag aaacccttag tatgtatttg tatttgtaaa 120 

atacttctat caataaaatt tctaattcct aaaaccaaaa tccagtacta aaatccagat 180 

cccccgaatt aattcggcgt taattcagca attcgtaatc atggtcatag ctgtttcctg 240 

tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 300 

aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 360 

ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 420 

gaggcggttt gcgtattggc tagagcagct tgccaacatg gtggagcacg acactctcgt 480 

ctactccaag aatatcaaag atacagtctc agaagaccaa agggctattg agacttttca 540 

acaaagggta atatcgggaa acctcctcgg attccattgc ccagctatct gtcacttcat 600 

caaaaggaca gtagaaaagg aaggtggcac ctacaaatgc catcattgcg ataaaggaaa 660 

ggctatcgtt caagatgcct ctgccgacag tggtcccaaa gatggacccc cacccacgag 720 

gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg attgatgtga 780 

taacatggtg gagcacgaca ctctcgtcta ctccaagaat atcaaagata cagtctcaga 840 

agaccaaagg gctattgaga cttttcaaca aagggtaata tcgggaaacc tcctcggatt 900 

ccattgccca gctatctgtc acttcatcaa aaggacagta gaaaaggaag gtggcaccta 960 

caaatgccat cattgcgata aaggaaaggc tatcgttcaa gatgcctctg ccgacagtgg 1020 

tcccaaagat ggacccccac ccacgaggag catcgtggaa aaagaagacg ttccaaccac 1080 

gtcttcaaag caagtggatt gatgtgatat ctccactgac gtaagggatg acgcacaatc 1140 

ccactatcct tcgcaagacc ttcctctata taaggaagtt catttcattt ggagaggaca 1200 

cgctgaaatc accagtctct ctctacaaat ctatctctct cgagtctacc atgagcccag 1260 

aacgacgccc ggccgacatc cgccgtgcca ccgaggcgga catgccggcg gtctgcacca 1320 
tcgtcaacca ctacatcgag acaagcacgg tcaacttccg taccgagccg caggaaccgc 1380 
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aggagtggac ggacgacctc gtccgtctgc gggagcgcta tccctggctc gtcgccgagg 1440 
tggacggcga ggtcgccggc atcgcctacg cgggcccctg gaaggcacgc aacgcctacg 1500 
actggacggc cgagtcgacc gtgtacgtct ccccccgcca ccagcggacg ggactgggct 1560 
ccacgctcta cacccacctg ctgaagtccc tggaggcaca gggcttcaag agcgtggtcg 1620 
ctgtcatcgg gctgcccaac gacccgagcg tgcgcatgca cgaggcgctc ggatatgccc 1680 
cccgcggcat gctgcgggcg gccggcttca agcacgggaa ctggcatgac gtgggtttct 1740 
ggcagctgga cttcagcctg ccggtaccgc cccgtccggt cctgcccgtc accgagattt 1800 
gactcgagtt tctccataat aatgtgtgag tagttcccag ataagggaat tagggttcct 1860 
atagggtttc gc.tcatgtgt tgagcatata agaaaccctt agtatgtatt tgtatttgta 1920 
aaatacttct atcaataaaa tttctaattc ctaaaaccaa aatccagtac taaaatccag 1980 
atcccccgaa ttaattcggc gttaattcag tacattaaaa acgtccgcaa tgtgttatta 2040 
agttgtctaa gcgtcaattt gtttacacca caatatatcc tgccaccagc cagccaacag 2100 
ctccccgacc ggcagctcgg cacaaaatca ccactcgata caggcagccc atcagtccgg 2160 
gacggcgtca gcgggagagc cgttgtaagg cggcagactt tgctcatgtt accgatgcta 2220 
ttcggaagaa cggcaactaa gctgccgggt ttgaaacacg gatgatctcg cggagggtag 2280 
catgttgatt gtaacgatga cagagcgttg ctgcctgtga tcaccgcggt ttcaaaatcg 2340 
gctccgtcga tactatgtta tacgccaact ttgaaaacaa ctttgaaaaa gctgttttct 2400 
ggtatttaag gttttagaat gcaaggaaca gtgaattgga gttcgtcttg ttataattag 2460 
cttcttgggg tatctttaaa tactgtagaa aagaggaagg aaataataaa tggctaaaat 2520 
gagaatatca ccggaattga aaaaactgat cgaaaaatac cgctgcgtaa aagatacgga 2580 
aggaatgtct cctgctaagg tatataagct ggtgggagaa aatgaaaacc tatatttaaa 2640 
aatgacggac agccggtata aagggaccac ctatgatgtg gaacgggaaa aggacatgat 2700 
gctatggctg gaaggaaagc tgcctgttcc aaaggtcctg cactttgaac ggcatgatgg 2760 
ctggagcaat ctgctcatga gtgaggccga tggcgtcctt tgctcggaag agtatgaaga 2820 
tgaacaaagc cctgaaaaga ttatcgagct gtatgcggag tgcatcaggc tctttcactc 2880 
catcgacata tcggattgtc cctatacgaa tagcttagac agccgcttag ccgaattgga 2940 
ttacttactg aataacgatc tggccgatgt ggattgcgaa aactgggaag aagacactcc 3000 
atttaaagat ccgcgcgagc tgtatgattt tttaaagacg gaaaagcccg aagaggaact 3060 
tgtcttttcc cacggcgacc tgggagacag caacatcttt gtgaaagatg gcaaagtaag 3120 
tggctttatt gatcttggga gaagcggcag ggcggacaag tggtatgaca ttgccttctg 3180 
cgtccggtcg atcagggagg atatcgggga agaacagtat gtcgagctat tttttgactt 3240 
actggggatc aagcctgatt gggagaaaat aaaatattat attttactgg atgaattgtt 3300 
ttagtaccta gaatgcatga ccaaaatccc ttaacgtgag ttttcgttcc actgagcgtc 3360 
agaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc gcgtaatctg 3420 
ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg atcaagagct 3480 
accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa atactgtcct 3540 
tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc ctacatacct 3600 
cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt gtcttaccgg 3660 
gttggactca agacgatagt taccggataa ggcigcagcgg tcgggctgaa cggggggttc 3720 
gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc tacagcgtga 3780 
gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg 3840 
cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct ggtatcttta 3900 
tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat gctcgtcagg 3960 
ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc tggccttttg 4020 
ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg ataaccgtat 4080 
taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc gcagcgagtc 4140 
agtgagcgag gaagcggaag agcgcctgat gcggtatttt ctccttacgc atctgtgcgg 4200 
tatttcacac cgcatatggt gcactctcag tacaatctgc tctgatgccg catagttaag 4260 
ccagtataca ctccgctatc gctacgtgac tgggtcatgg ctgcgccccg acacccgcca 4320 
acacccgctg acgcgccctg acgggcttgt ctgctcccgg catccgctta cagacaagct 4380 
gtgaccgtct ccgggagctg catgtgtcag aggttttcac cgtcatcacc gaaacgcgcg 4440 
aggcagggtg ccttgatgtg ggcgccggcg gtcgagtggc gacggcgcgg cttgtccgcg 4500 
ccctggtaga ttgcctggcc gtaggccagc catttttgag cggccagcgg ccgcgatagg 4560 
ccgacgcgaa gcggcggggc gtagggagcg cagcgaccga agggtaggcg ctttttgcag 4620 
ctcttcggct gtgcgctggc cagacagtta tgcacaggcc aggcgggttt taagagtttt 4680 
aataagtttt aaagagtttt aggcggaaaa atcgcctttt ttctctttta tatcagtcac 4740 
ttacatgtgt gaccggttcc caatgtacgg ctttgggttc ccaatgtacg ggttccggtt 4800 
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cccaatgtac ggctttgggt tcccaatgta cgtgctatcc acaggaaaga gaccttttcg 4860 
acctttttcc cctgctaggg caatttgccc tagcatctgc tccgtacatt aggaaccggc 4920 
ggatgcttcg ccctcgatca ggttgcggta gcgcatgact aggatcgggc cagcctgccc 4980 
cgcctcctcc ttcaaatcgt actccggcag gtcatttgac ccgatcagct tgcgcacggt 5040 
gaaacagaac ttcttgaact ctccggcgct gccactgcgt tcgtagatcg tcttgaacaa 5100 
ccatctggct tctgccttgc ctgcggcgcg gcgtgccagg cggtagagaa aacggccgat 5160 
gccgggatcg atcaaaaagt aatcggggtg aaccgtcagc acgtccgggt tcttgccttc 5220 
tgtgatctcg cggtacatcc aatcagctag ctcgatctcg atgtactccg gccgcccggt 5280 
ttcgctcttt acgatcttgt agcggctaat caaggcttca ccctcggata ccgtcaccag 5340 
gcggccgttc ttggccttct tcgtacgctg catggcaacg tgcgtggtgt ttaaccgaat 5400 
gcaggtttct accaggtcgt ctttctgctt . tccgccatcg gctcgccggc agaacttgag 5460 
tacgtccgca acgtgtggac ggaacacgcg gccgggcttg tctcccttcc cttcccggta 5520 
tcggttcatg gattcggtta gatgggaaac cgccatcagt accaggtcgt aatcccacac 5580 
actggccatg ccggccggcc ctgcggaaac ctctacgtgc ccgtctggaa gctcgtagcg 5640 
gatcacctcg ccagctcgtc ggtcacgctt cgacagacgg aaaacggcca cgtccatgat 5700 
gctgcgacta tcgcgggtgc ccacgtcata gagcatcgga acgaaaaaat ctggttgctc 5760 
gtcgcccttg ggcggcttcc taatcgacgg cgcaccggct gccggcggtt gccgggattc 5820 
tttgcggatt cgatcagcgg ccgcttgcca cgattcaccg gggcgtgctt ctgcctcgat 5880 
gcgttgccgc tgggcggcct gcgcggcctt caacttctcc aCCaggtcat cacccagcgc 5940 
cgcgccgatt tgtaccgggc cggatggttt gcgaccgtca cgccgattcc* tcgggcttgg 6000 
gggttccagt gccattgcag ggccggcaga caacccagcc gcttacgcct ggccaaccgc 6060 
ccgttcctcc acacatgggg cattccacgg cgtcggtgcc tggttgttct tgattttcca 6120 
tgccgcctcc tttagccgct aaaattcatc tactcattta ttcatttgct catttactct 6180 
ggtagctgcg cgatgtattc agatagcagc tcggtaatgg tcttgccttg gcgtaccgcg 6240 
tacatcttca gcttggtgtg atcctccgcc ggcaactgaa agttgacccg cttcatggct 6300 
ggcgtgtctg ccaggctggc caacgttgca gccttgctgc tgcgtgcgct cggacggccg 6360 
gcacttagcg tgtttgtgct tttgctcatt ttctctttac ctcattaact caaatgagtt 6420 
ttgatttaat ttcagcggcc agcgcctgga cctcgcgggc agcgtcgccc tcgggttctg 6480 
attcaagaac ggttgtgccg gcggcggcag tgcctgggta gctcacgcgc tgcgtgatac 6540 
gggactcaag aatgggcagc tcgtacccgg ccagcgcctc ggcaacctca ccgccgatgc 6600 
gcgtgccttt gatcgcccgc gacacgacaa aggccgcttg tagccttcca tccgtgacct 6660 
caatgcgctg cttaaccagc tccaccaggt cggcggtggc ccatatgtcg taagggcttg 6720 
gctgcaccgg aatcagcacg aagtcggctg ccttgatcgc ggacacagcc aagtccgccg 6780 
cctggggcgc tccgtcgatc actacgaagt cgcgccggcc gatggccttc acgtcgcggt 6840 
caatcgtcgg gcggtcgatg ccgacaacgg ttagcggttg atcttcccgc acggccgccc 6900 
aatcgcgggc actgccctgg ggatcggaat cgactaacag aacatcggcc ccggcgagtt 6960 
gcagggcgcg ggctagatgg gttgcgatgg tcgtcttgcc tgacccgcct ttctggttaa 7020 
gtacagcgat aaccttcatg cgttcccctt gcgtatttgt ttatttactc. atcgcatcat 7080 
atacgcagcg acc'gcatgac gcaagctgtt ttactcaaat acacatcacc tttttagacg 7140 
gcggcgctcg gtttcttcag- cggccaagct ggccggccag gccgccagct tggcatcaga 7200 
caaaccggcc aggatttcat gcagccgcac ggttgagacg tgcgcgggcg gctcgaacac 7260 
gtacccggcc gcgatcatct ccgcctcgat ctcttcggta atgaaaaacg gttcgtcctg 7320 
gccgtcctgg tgcggtttca tgcttgttcc tcttggcgtt cattctcggc ggccgccagg 7380 
gcgtcggcct cggtcaatgc gtcctcacgg aaggcaccgc gccgcctggc ctcggtgggc 7440 
gtcacttcct cgctgcgctc aagtgcgcgg tacagggtcg agcgatgcac gccaagcagt 7500 
gcagccgcct ctttcacggt gcggccttcc tggtcgatca gctcgcgggc gtgcgcgatc 7560 
tgtgccgggg tgagggtagg gcgggggcca aacttcacgc ctcgggcctt ggcggcctcg 7620 
cgcccgctcc gggtgcggtc gatgattagg gaacgctcga actcggcaat gccggcgaac 7680 
acggtcaaca ccatgcggcc ggccggcgtg gtggtgtcgg cccacggctc tgccaggcta 7740 
cgcaggcccg cgccggcctc ctggatgcgc tcggcaatgt ccagtaggtc gcgggtgctg 7800 
cgggccaggc ggtctagcct ggtcactgtc acaacgtcgc cagggcgtag gtggtcaagc 7860 
atcctggcca gctccgggcg gtcgcgcctg gtgccggtga tcttctcgga aaacagcttg 7920 
gtgcagccgg ccgcgtgcag ttcggcccgt tggttggtca agtcctggtc gtcggtgctg 7980 
acgcgggcat agcccagcag gccagcggcg gcgctcttgt tcatggcgta atgtctccgg 8040 
ttctagtcgc aagtattcta ctttatgcga ctaaaacacg cgacaagaaa acgccaggaa 8100 
aagggcaggg cggcagcctg tcgcgtaact taggacttgt gcgacatgtc gttttcagaa 8160 
gacggctgca ctgaacgtca gaagccgact gcactatagc agcggagggg ttggatcaaa 8220 
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gtactttgat cccgagggga accctgtggt tggcatgcac atacaaatgg acgaacggat 8280 
aaaccttttc acgccctttt aaatatccgt tattctaata aacgctcttt tctcttaggt 8340 
ttacccgcca atatatcctg tcaaacactg atagtttaaa ctgaaggcgg gaaacgacaa 8400 
tctgatccaa gctcaagctg ctctagcatt cgccattcag gctgcgcaac tgttgggaag 8460 
ggcgatcggt gcgggcctct tcgctattac gccagctggc gaaaggggga tgtgctgcaa 8520 
ggcgattaag ttgggtaacg ccagggtttt cccagtcacg acgttgtaaa acgacggcca 8580 
gtgccaagct tttggctaga gcagcttgcc aacatggtgg agcacgacac tctcgtctac 8640 
tccaagaata tcaaagatac agtctcagaa gaccaaaggg ctattgagac ttttcaacaa 8700 
agggtaatat cgggaaacct cctcggattc cattgcccag ctatctgtca cttcatcaaa 8760 
aggacagtag aaaaggaagg tggcacctac aaatgccatc attgcgataa aggaaaggct 8820 
atcgttcaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 8880 
atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgataac 8940 
atggtggagc acgacactct cgtctactcc aagaatatca aagatacagt ctcagaagac 9000 
caaagggcta ttgagacttt tcaacaaagg gtaatatcgg gaaacctcct cggattccat 9060 
tgcccagcta tctgtcactt catcaaaagg acagtagaaa aggaaggtgg cacctacaaa 9120 
tgccatcatt gcgataaagg aaaggctatc gttcaagatg cctctgccga cagtggtccc 9180 
aaagatggac ccccacccac gaggagcatc gtggaaaaag aagacgttcc aaccacgtct 9240 
tcaaagcaag tggattgatg tgatatctcc actgacgtaa gggatgacgc acaatcccac 9300 
tatccttcgc aagaccttcc tctatataag gaagttcatt tcatttggag aggacacgct 9360 
gaaatcacca gtctctctct acaaatctat ctctccatgg catgttctgc aggtcgactc 9420 
tagaggatcc ccgggtaccg agctcgaaga tcttcgacgt cggaattcat ggactcaaag 9480 
tcggttactc cagaaccaac caaccccttc tacgcttctt cggggcaatc aggaaaaacc 9540 
tatgcttctg ttgtcgccgc cgctgctgct gcagccgccg ataaggagga tggtggtgct 9600 
gtgagtagtg ccaaggagtt ggattcctca tcggaggctg tgtctggtaa ttcggataag 9660 
gttggagctg atgatttatc tgactccgag aaggagaagc cgaatttggt gggtgatggg 9720 
aaggtttccg acgaggtgga tggttcttta aaggaggatt ctactactcc tgaggctact 9780 
ccgaagcctg aggtggtttc tggtgagaca attggtgtag atgatgtttc atcgttatct 9840 
ccgaagccgg aggctgtttc tgatggtgta ggggttgtgg aggagaataa gaaggttaag 9900 
gaggacgtgg aggatattaa agacgatggt gagagtaaga ttgaaaatgg gagtgttgat 9960 
gttgatgtga aacaggcttc cacagatggg gagagtgaga aagcttccaa cacttgtcac 10020 
tactttctct tatggtgttc aatgcttttc aagataccca gatcatatga aacggcatga 10080 
cttcttcaag agcgccatgc ctgagggata cgtgcaggag aggaccatct tcttcaagga 10140 
cgacgggaac tacaagacac gtgctgaagt caagtttgag ggagacaccc tcgtcaacag 10200 
gatcgagctt aagggaatcg atttcaagga ggacggaaac atcctcggcc acaagttgga 10260 
atacaactac aactcccaca acgtatacat catggccgac aagcaaaaga acggcatcaa 10320 
agccaacttc aagacccgcc acaacatcga agacggcggc gtgcaactcg ctgatcatta 10380 
tcaacaaaat actccaattg gcgatggccc tgtcctttta ccagacaacc attacctgtc 10440 
cacacaatct gccctttcga aagatcccac cgaaaagaga gaccacatgg tccttcttga 10500 
gtttgtaaca gctgctggga ttacacatgg catggatgaa ctatacaaac atgatgagct 10560 
ttaaggatcc ttaaagctca tcatgtttgt atagttcatc catgccatgt gtaatcccag 10620 
cagctgttac aaactcaaga aggaccatgt ggtctctctt ttcggtggga tctttcgaaa 10680 
gggcagattg tgtggacagg taatggttgt ctggtaaaag gacagggcca tcgccaattg 10740 
gagtattttg ttgataatga tcagcgagtt gcacgccgcc gtcttcgatg ttgtggcggg 10800 
tcttgaagtt ggctttgatg ccgttctttt gcttgtcggc catgatgtat acgttgtggg 10860 
agttgtagtt gtattccaac ttgtggccga ggatgtttcc gtcctccttg aaatcgattc 10920 
ccttaagctc gatcctgttg acgagggtgt ctccctcaaa cttgacttca gcacgtgtct 10980 
tgtagttccc gtcgtccttg aagaagatgg tcctctcctg cacgtatccc tcaggcatgg 11040 
cgctcttgaa gaagtcatgc cgtttcatat gatctgggta tcttgaaaag cattgaacac 11100 
cataagagaa agtagtgaca agtgttggaa gctttctcac tctccccatc tgtggaagcc 11160 
tgtttcacat caacatcaac actcccattt tcaatcttac tctcaccatc gtctttaata 11220 
tcctccacgt cctccttaac cttcttattc tcctccacaa cccctacacc atcagaaaca 11280 
gcctccggct tcggagataa cgatgaaaca tcatctacac caattgtctc accagaaacc 11340 
acctcaggct tcggagtagc ctcaggagta gtagaatcct cctttaaaga accatccacc 11400 
tcgtcggaaa ccttcccatc acccaccaaa ttcggcttct ccttctcgga gtcagataaa 11460 
tcatcagctc caaccttatc cgaattacca gacacagcct ccgatgagga atccaactcc 11520 
ttggcactac tcacagcacc accatcctcc ttatcggcgg ctgcagcagc agcggcggcg 11580 
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acaacagaag cataggtttt tcctgattgc cccgaagaag cgtagaaggg gttggttggt 11640 



<210> 123 

<211> 36 

<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: 
oligonucleotide primer 

<400> 123 

ctcgaggaat tcatggactc aaagtcggtt actcca 36 

<210> 124 

<211> 40 

<212> DNA 

<213> Ktinstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: 
oligonucleotide primer 

<400> 124 

ggatccataa gcaagctttc tcactctccc catctgtgga 40 

<210> 125 
<211> 26 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotide primer 

<400> 125 

aagcttccaa cacttgtcac tacttt 26 

<210> 126 
<211> 26 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotide primer 

<400> 126 

ggatccttaa agctcatcat gtttgt 26 



tctggagtaa ccgactttga gtccatg 
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